谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

谷歌发布了一个新的视频框架:

只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频。

视频时长可变,目前看到的示例最高为 10s。

可以看到,无论是口型还是面部表情,它都非常自然。

如果输入图像囊括整个上半身,它也能配合丰富的手势:

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

网友看完就表示:

有了它,以后咱开线上视频会议再也不需要整理好发型、穿好衣服再去了。

嗯,拍一张肖像,录好演讲音频就可以(手动狗头)

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

用声音控制肖像生成视频

这个框架名叫VLOGGER。

它主要基于扩散模型,并包含两部分:

一个是随机的人体到 3D 运动(human-to-3d-motion)扩散模型。

另一个是用于增强文本到图像模型的新扩散架构。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

其中,前者负责将音频波形作为输入,生成人物的身体控制动作,包括眼神、表情和手势、身体整体姿势等等。

后者则是一个时间维度的图像到图像模型,用于扩展大型图像扩散模型,使用刚刚预测的动作来生成相应的帧。

为了使结果符合特定的人物形象,VLOGGER 还将参数图像的 pose 图作为输入。

VLOGGER 的训练是在一个超大的数据集(名叫 MENTOR)上完成的。

有多大?全长 2200 小时,共包含 80 万个人物视频。

其中,测试集的视频时长也有 120 小时长,共计 4000 个人物。

谷歌介绍,VLOGGER 最突出的表现是具备多样性:

如下图所示,最后的像素图颜色越深(红)的部分,代表动作越丰富。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

而和业内此前的同类方法相比,VLOGGER 最大的优势则体现在不需要对每个人进行训练、也不依赖于面部检测和裁剪,并且生成的视频很完整(既包括面部和唇部,也包括肢体动作)等等。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

具体来看,如下表所示:

Face Reenactment 方法无法用音频和文本来控制此类视频生成。

Audio-to-motion 倒是可以音频生成,方式也是将音频编码为 3D 人脸动作,不过它生成的效果不够逼真。

Lip sync 可以处理不同主题的视频,但只能模拟嘴部动作。

对比起来,后面的两种方法 SadTaker 和 Styletalk 表现最接近谷歌 VLOGGER,但也败在了不能进行身体控制上,并且也不能进一步编辑视频。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

说到视频编辑,如下图所示,VLOGGER 模型的应用之一就是这个,它可以一键让人物闭嘴、闭眼、只闭左眼或者全程睁眼:

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

另一个应用则是视频翻译

例如将原视频的英语讲话改成口型一致的西班牙语。

网友吐槽

最后,” 老规矩 “,谷歌没有发布模型,现在能看的只有更多效果还有论文。

嗯,吐槽也是不少的:

画质模型、口型抽风对不上、看起来还是很机器人等等。

因此,有人毫不犹豫打上差评:

这就是谷歌的水准吗?

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

有点对不起 “VLOGGER” 这个名字了。

 谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频

——和 OpenAI 的 Sora 对比,网友的说法确实也不是没有道理。。

大家觉得呢?

更多效果:

https://enriccorona.github.io/vlogger/

完整论文:

https://enriccorona.github.io/vlogger/paper.pdf

以上就是谷歌发布“ Vlogger ”模型:单张图片生成 10 秒视频的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/16824.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月30日 19:32:50
下一篇 2025年11月30日 19:38:56

相关推荐

  • 谷歌搜索的鼠标悬停阴影效果是如何实现的?

    谷歌搜索悬停阴影效果解析 在谷歌搜索页面中,当鼠标悬停在搜索框或按钮上时,会出现一个微妙的边缘阴影。想要了解这一效果的实现原理,许多开发者可能率先想到使用 css。 css 探索 遗憾的是,在 css 代码中无法找到与阴影效果直接相关的属性或值。继续探索其他实现方法。 浏览器开发者工具助力 使用浏览…

    2025年12月24日
    000
  • 如何用 CSS 实现谷歌搜索框鼠标悬停时的边缘阴影效果?

    谷歌搜索框鼠标悬停时边缘阴影效果实现 对于谷歌搜索框在鼠标悬停时的边缘阴影效果,你可能找不到直接的 css 代码,但这种效果可以通过 box-shadow 属性实现。 box-shadow 可以创建箱子周围的阴影效果,它的语法如下: box-shadow: h-offset v-offset blu…

    2025年12月24日
    200
  • 如何实现谷歌搜索框鼠标悬停时的边缘阴影效果?

    如何实现谷歌搜索框鼠标悬停时的边缘阴影效果? 在谷歌搜索中,当鼠标悬停在搜索框和按钮上时,会产生一种精致的边缘阴影效果。实现这一效果需要使用 css 的 box-shadow 属性。 box-shadow 属性 box-shadow 属性允许在元素周围创建阴影效果。其语法为: box-shadow:…

    2025年12月24日
    200
  • 鼠标悬停时,谷歌搜索元素的阴影效果是如何实现的?

    鼠标悬停时突出显示谷歌搜索元素的阴影效果是如何实现的 该效果是通过 css 的 box-shadow 属性实现的,该属性用于在元素周围创建阴影效果。 当鼠标悬停在元素上时,应用 :hover 伪类,并添加 box-shadow 属性,为元素指定阴影效果。 下面是一个示例 css 代码,它给谷歌搜索框…

    2025年12月24日
    100
  • CSS 砌体 Catness

    css 就像技术中的其他东西一样 – 它总是在变化和发展。该领域正在进行的开发是 css 网格布局模块级别 3,也称为 css masonry 布局。 theo 制作了一段视频,介绍了它的开发方式以及苹果和谷歌就如何实施它进行的辩论。 所有这些让我很高兴尝试 css 砌体! webkit…

    好文分享 2025年12月24日
    000
  • 谷歌浏览器重命名文件后缩进消失,火狐浏览器却不会,这是为什么?

    谷歌浏览器重命名文件后缩进消失,而火狐浏览器不会 在谷歌浏览器中使用 WEB IDE 时遇到一个奇怪的问题。当重命名目录树中的文件后,目录树左侧的缩进消失了。但是,在开发者工具中发现导致缩进消失的其实是设置了 margin-right: -17px,而不是正常的 margin-left: -17px…

    2025年12月24日
    000
  • 为什么重命名文件后,谷歌浏览器和火狐浏览器的目录树缩进表现不同?

    为什么在重命名文件后,谷歌浏览器和火狐浏览器的目录树表现不同? 一位开发者遇到了一个令人迷惑的问题:在谷歌浏览器中的 WEB IDE 中重命名文件时,目录树中的缩进会消失。经过检查,开发者发现目录树元素有一个 margin-right:-17px 样式,这与预期中 margin-left:-17px…

    2025年12月24日
    300
  • 谷歌浏览器和火狐浏览器在重命名文件时,为何表现出不同的缩进差异?

    浏览器在重命名文件时表现差异的原因 当你使用谷歌浏览器中的 WEB IDE 重命名文件时,你遇到的问题是:整个目录树向左移动,缩进消失。同时,你发现该元素设置了 margin-right: -17px,但它应该设置为 margin-left: -17px。 这个问题的原因是因为谷歌浏览器在处理 CS…

    2025年12月24日
    200
  • 谷歌浏览器目录树缩进消失:是 Bug 还是配置问题?

    浏览器中的目录树缩进差异 问题: 在谷歌浏览器使用 WEB IDE 时,重命名文件会消除目录树的缩进,但火狐浏览器没有这个问题。这是谷歌的 Bug 吗? 答案: 不是谷歌的 Bug。 解释: 在 Google 浏览器中,浏览器错误地将 margin-right:-17px 应用于目录树元素,而不是 …

    2025年12月24日
    000
  • 为什么前端固定定位能够产生动态效果解析

    前端固定定位是一种常见的CSS属性,它可以将元素固定在页面的特定位置,不随页面滚动而改变位置。与普通定位不同,固定定位在页面中的位置是相对于视窗而言的,而不是相对于父元素。这种固定定位的效果正是因为其动态特性而变得更加吸引人。 固定定位产生动态效果的主要原因有以下几个方面: 滚动效果:当页面发生滚动…

    2025年12月24日
    000
  • 探索粘性定位的成功要素,以加强其效果

    粘性定位是指网页或移动应用中,页面元素能够随着用户滑动而保持在某一固定位置的特性。它可以提供更好的用户体验,让用户更加方便地访问页面中重要的信息或操作。在设计和开发过程中,如何提高粘性定位的效果成为一个关键的问题。本文将解读粘性定位的成功因素,并提出一些提高效果的方法。 一、设计合理的页面布局在设计…

    2025年12月24日
    000
  • 绝对定位能在哪些场景下最大化效果发挥?

    绝对定位在哪些场景下能够发挥最大的效果? 绝对定位(Position: absolute)是CSS中一种非常有用的布局方式,通过设置元素的位置属性来精确地控制元素在页面上的位置。在某些特定的场景下,绝对定位可以发挥最大的效果,为我们创建出更加复杂和丰富的页面布局。本文将介绍几个使用绝对定位的常见场景…

    2025年12月24日
    000
  • 如何使用CSS制作标签云的效果

    如何使用CSS制作标签云的效果 标签云是一种常见的网页设计元素,它以不同大小和颜色的标签组成,用于展示关键词或标签的热门程度。在本文中,我们将介绍如何使用CSS来制作标签云的效果,并提供具体的代码示例。 HTML 结构首先,我们需要在HTML中创建一个容器元素,用于包裹标签云的内容。可以使用一个无序…

    2025年12月24日
    000
  • 利用CSS实现图片悬浮效果的技巧和方法

    利用CSS实现图片悬浮效果的技巧和方法 在网页设计中,图片悬浮效果是一种常见且吸引眼球的设计方式。通过悬浮效果,可以让用户在鼠标悬浮在图片上时,出现一些动画效果、文字说明或者其他有趣的交互效果。本文将介绍一些利用CSS实现图片悬浮效果的技巧和方法,并提供具体的代码示例。 放大效果 通过Scale属性…

    2025年12月24日
    000
  • CSS3属性:text-shadow文本阴影的使用方法

    本篇文章给大家带来的内容是关于css3属性:text-shadow文本阴影的使用方法,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 text-shadow还没有出现时,大家在网页设计中阴影一般都是用photoshop做成图片,现在有了css3可以直接使用text-shadow属性来…

    2025年12月24日 好文分享
    000
  • css实现图片切换效果

    本篇文章主要介绍css实现图片切换效果非常不错,不用css,代码比较精简,推荐使用,注意一下多浏览器的兼容性。 代码如下: 纯css图切换 练习 教程来自snwebsite a{ display:block; border:1px solid #cccccc; width:20px; height:…

    好文分享 2025年12月24日
    000
  • css实现鼠标触发效果

    本片文章主要介绍使用css实现鼠标触发效果,感兴趣的朋友参考下。 代码如下: css打造鼠标触发效果 <!– startList = function() { if (document.all&&document.getElementById) { navRoot = doc…

    好文分享 2025年12月24日
    000
  • css 编写表单效果

    本篇文章主要介绍如何使用p+css实现表单效果,纯p+css实现,大家可以参考下。 代码如下: by 阿会楠 2008-12-4 //js辅助 window.onload = function(){ var initleft = 200;// 初始化第一个定位 var lis = document.…

    2025年12月24日
    000
  • css 过渡动画效果

    这篇文章主要介绍了css 过渡动画效果,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 p{ width:40px; height:40px; background:url(http://www.uc.cn/images1_4/sprite_uc_android.png); trans…

    好文分享 2025年12月24日
    000
  • 代码实现css鼠标经过元素下划线两边展开效果

    这篇文章主要介绍了代码实现css鼠标经过元素下划线两边展开效果,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧 鼠标移入下划线展开#underline{ width: 200px; height: 50px; background: #ddd; margin: 20px;…

    好文分享 2025年12月24日
    000

发表回复

登录后才能评论
关注微信