sora_第2页_创想鸟

想训练类Sora模型吗？尤洋团队OpenDiT实现80%加速

Sora 在 2024 年初的惊艳表现成为了新的标杆，激励着所有研究文生视频的人士争相追赶。每个研究者都怀着复现 Sora 成果的渴望，争分夺秒地努力着。根据 OpenAI 披露的技术报告，Sora 的一个重要创新点是将视觉数据转换为 patch 的统一表示形式，并通过 Transformer 和…

程序猿

2025年12月1日 • 用户投稿

0000

AI视频又炸了！照片+声音变视频，阿里让Sora女主唱歌小李子说RAP

sora之后，居然还有新的ai视频模型，能惊艳得大家狂转狂赞！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片有了它，《狂飙》大反派高启强化身罗翔，都能给大伙儿普法啦（狗头）。这就是阿里最新推出的基于音频驱动的肖像视频生成框架，EM…

程序猿

2025年12月1日 • 用户投稿

1000

让Sora东京女郎唱歌、高启强变声罗翔，阿里人物口型视频生成绝了

有了阿里的 emo，ai 生成或真实的图像「动起来说话或唱歌」变得更容易了。最近，以 OpenAI Sora 为代表的文生视频模型又火了起来。除了文本生成视频，以人为中心的视频合成一直备受关注。比如，专注于“说话人头部”的视频生成，其目标是根据用户提供的音频片段生成面部表情。在技术层面上，生成…

程序猿

2025年12月1日 • 用户投稿

0000

字节万卡集群技术细节公开：2天搞定GPT-3训练，算力利用率超英伟达Megatron-LM

随着对sora技术分析的展开，ai基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注：文章披露，字节搭建起的万卡集群，能在1.75天内完成GPT-3规模模型（175B）的训练。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜…

程序猿

2025年12月1日 • 用户投稿

0000

周鸿祎2024大模型预测已验证八条称Sora出现超出预料

“我讲课不割韭菜，宗旨是免费、分享、科普、交流。ai时代技术发展迅速，ai知识普及尤为重要。”2月29日，360公司创始人周鸿祎免费课正式开启，全网多平台直播了ai系列第一讲“预见agi”，千万网友观看。免费课上，周鸿祎系统分享了对ai新发展趋势的洞察、企业拥抱ai的建议，并现场演示了大模型重塑的两…

程序猿

2025年12月1日 • 用户投稿

2000

《妈妈咪呀》国际女星一夜被AI端掉饭碗！

前几天，OpenAI刚宣布进军好莱坞，并放出一波导演艺术家们体验Sora的震撼视频。仅仅几天的时间，已经有国际著名明星，饭碗一夜之间被AI端掉了！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 她，就是音乐剧《妈妈咪呀》的主演——Sara…

程序猿

2025年12月1日 • 用户投稿

1000

【Multi-Agent实战】如何用 LangChain 打造一个 Multi-Agent 实战项目

【multi-agent】一、如何用 langchain 打造一个 multi-agent 实战 ✍ 前言这篇就是给已经玩过 langchain tools + agent 的同学看的进阶篇：你已经玩过 time / weather 这种自定义工具；也看过 AgentType.CHAT_ZERO…

程序猿

2025年12月1日 • 用户投稿

0000

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。因此，扩散模型在计算机视觉、自然语言处理等方面备…

程序猿

2025年12月1日 • 用户投稿

0000

清华叉院、理想提出DriveVLM，视觉大语言模型提升自动驾驶能力

在自动驾驶领域，研究人员也在朝着 gpt/sora 等大模型方向进行探索。与生成式 AI 相比，自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统，人们面临的主要挑战是 AI 的场景理解，这会涉及到复杂、不可预测的场景，例如恶劣天气、复杂的道路布局和不可预见的人类行为。…

程序猿

2025年12月1日 • 用户投稿

1000

国内高校打造类Sora模型VDT，通用视频扩散Transformer被ICLR 2024接收

2 月 16 日，OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构，和市面上大部分主流方法（由 2D Stable Diffusion 扩展）并不相同。为什么 Sora 坚持使用 Diffusion Transfo…

程序猿

2025年12月1日 • 用户投稿

1000