openai 和谷歌在ai领域持续发力,openai 推出sora,谷歌推出veo2,但sora的高昂价格和veo2的封闭测试引发热议。 与此同时,一家中国公司图森未来却选择开源其图生视频大模型——ruyi。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Ruyi-Mini-7B版本已可在Hugging Face平台下载:https://www.php.cn/link/5c6a2ff5001c13fb4b0425a45e5b8e11 GitHub代码链接:https://www.php.cn/link/a47cc7b881ce40bc6ba3e71d5d47fbf1 官方还提供部署说明和ComfyUI工作流,支持消费级显卡运行。

官方Demo展示了Ruyi强大的生成能力,包括逼真的写实人物、动画角色和自然风景等:




Ruyi性能测试:
Ruyi基于单张图片即可生成最高720P、时长5秒的视频,支持任意长宽比。 它支持多起始帧和结束帧,可生成任意长度视频,并提供运动幅度和镜头控制选项。
腾讯云AI代码助手
基于混元代码大模型的AI辅助编码工具
172 查看详情



在写实风格、影视剧照、动画风格、动物和风景等方面,Ruyi展现了不错的生成能力,但仍存在一些不足,例如手部畸形和细节缺失。











图森未来转型:
图森未来,一家原智能驾驶公司,于今年8月进军ACG市场,并成立生成式AI部门。Ruyi的开源,体现了其将自动驾驶技术经验应用于AI生成领域的策略。
Ruyi基于DiT架构,参数量约7.1B,训练数据约200M个视频片段。 图森未来计划于2025年推出闭源模型Ruyi Standard及相关工具,2026年发布更强大的版本。


视频链接:https://www.php.cn/link/6863f2f626660f54ec03d557f9b79bd6
以上就是智驾公司下场搞AI视频生成,模型上线即开源的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/782933.html
微信扫一扫
支付宝扫一扫