谷歌近日发布了其视频生成模型veo3.1,作为今年5月推出的veo3的进阶版本。此次升级在音频生成、编辑控制精度以及图像转视频的表现质量上均有显著优化,能够产出更加逼真的视频内容,并更精准地响应用户的提示指令。
在功能方面,Veo3.1支持向现有画面中添加新对象,系统会自动将其与原始场景的视觉风格相融合,实现自然衔接。谷歌还预告,其视频编辑工具Flow即将上线移除视频中已有对象的功能,进一步提升创作过程中的灵活性与可控性。

此前,Veo3已具备多种高级编辑能力,例如基于参考图像生成角色动作、由首尾帧自动生成中间动画,以及根据末帧延伸视频内容等。而Veo3.1的关键突破在于为所有这些编辑操作新增了音频生成功能,使得输出的视频不仅包含画面,还能配备匹配情境的声音元素,显著增强了视听体验的真实感与沉浸感。
从发布渠道来看,Veo3.1将通过多个平台向用户开放。谷歌正将其集成至自家视频编辑工具Flow、Gemini应用,以及面向开发者的Vertex AI和Gemini API中。官方数据显示,自Flow于5月上线以来,用户已累计创作超过2.75亿个AI生成视频,显示出强劲的应用需求。
此次更新反映了AI视频生成技术的两大发展趋势:一是生成质量的不断提升——包括画质真实性、动作连贯性和对提示语的理解准确性;二是编辑能力日益精细化——从整体生成逐步发展到局部修改、对象增删等更为复杂的操作。同时,音频生成的引入也弥补了当前多数AI视频工具缺乏声音支持的普遍短板。
然而,整体技术仍处于快速演进阶段。在视频时序一致性、物理规律遵循、复杂动态场景处理等方面,行业内的各类模型仍在持续优化。Veo3.1在实际应用中的表现,如音画同步的精准度、新增对象与原场景融合的自然程度等细节,仍有待大量用户实践来检验和反馈。
以上就是谷歌 Veo 3.1 正式发布:新增音频功能和精细化编辑能力的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/11147.html
微信扫一扫
支付宝扫一扫