sora
-
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
Sora 在 2024 年初的惊艳表现成为了新的标杆,激励着所有研究文生视频的人士争相追赶。每个研究者都怀着复现 Sora 成果的渴望,争分夺秒地努力着。 根据 OpenAI 披露的技术报告,Sora 的一个重要创新点是将视觉数据转换为 patch 的统一表示形式,并通过 Transformer 和…
-
AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说RAP
sora之后,居然还有新的ai视频模型,能惊艳得大家狂转狂赞! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 有了它,《狂飙》大反派高启强化身罗翔,都能给大伙儿普法啦(狗头)。 这就是阿里最新推出的基于音频驱动的肖像视频生成框架,EM…
-
让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了
有了阿里的 emo,ai 生成或真实的图像「动起来说话或唱歌」变得更容易了。 最近,以 OpenAI Sora 为代表的文生视频模型又火了起来。 除了文本生成视频,以人为中心的视频合成一直备受关注。比如,专注于“说话人头部”的视频生成,其目标是根据用户提供的音频片段生成面部表情。 在技术层面上,生成…
-
字节万卡集群技术细节公开:2天搞定GPT-3训练,算力利用率超英伟达Megatron-LM
随着对sora技术分析的展开,ai基础设施的重要性愈发凸显。 来自字节和北大的一篇新论文在此时吸引关注: 文章披露,字节搭建起的万卡集群,能在1.75天内完成GPT-3规模模型(175B)的训练。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜…
-
周鸿祎2024大模型预测已验证八条 称Sora出现超出预料
“我讲课不割韭菜,宗旨是免费、分享、科普、交流。ai时代技术发展迅速,ai知识普及尤为重要。”2月29日,360公司创始人周鸿祎免费课正式开启,全网多平台直播了ai系列第一讲“预见agi”,千万网友观看。免费课上,周鸿祎系统分享了对ai新发展趋势的洞察、企业拥抱ai的建议,并现场演示了大模型重塑的两…
-
《妈妈咪呀》国际女星一夜被AI端掉饭碗!
前几天,OpenAI刚宣布进军好莱坞,并放出一波导演艺术家们体验Sora的震撼视频。 仅仅几天的时间,已经有国际著名明星,饭碗一夜之间被AI端掉了! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 她,就是音乐剧《妈妈咪呀》的主演——Sara…
-
【Multi-Agent实战】如何用 LangChain 打造一个 Multi-Agent 实战项目
【multi-agent】一、如何用 langchain 打造一个 multi-agent 实战 ✍ 前言 这篇就是给已经玩过 langchain tools + agent 的同学看的进阶篇: 你已经玩过 time / weather 这种自定义工具;也看过 AgentType.CHAT_ZERO…
-
爆火Sora背后的技术,一文综述扩散模型的最新发展方向
为了使机器具有人类的想象力,深度生成模型取得了重大进展。这些模型能创造逼真的样本,尤其是扩散模型,在多个领域表现出色。扩散模型解决了其他模型的限制,如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此,扩散模型在计算机视觉、自然语言处理等方面备…
-
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
在自动驾驶领域,研究人员也在朝着 gpt/sora 等大模型方向进行探索。 与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。…
-
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收
2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。 为什么 Sora 坚持使用 Diffusion Transfo…