两步生成25帧高质量动画,计算为SVD的8% | 在线可玩

耗费的计算资源仅为传统stable video diffusion(svd)模型的2/25

AnimateLCM-SVD-xt发布,一改视频扩散模型进行重复去噪,既耗时又需大量计算的问题。

先来看一波生成的动画效果。

赛博朋克风轻松驾驭,男孩头戴耳机,站在霓虹闪烁的都市街道:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

写实风也可以,一对新婚夫妇依偎在一起,手捧精致花束,在古老石墙下见证爱情:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

科幻风,也有了外星人入侵地球的即视感:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

AnimateLCM-SVD-xt由来自香港中文大学MMLab、Avolution AI、上海人工智能实验室、商汤研究院的研究人员共同提出。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

2~8步就能生成25帧分辨率576×1024的高质量动画,并且无需分类器引导,4步生成的视频就能实现高保真,比传统SVD更快、效率更高:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

目前,AnimateLCM代码即将开源,有在线demo可试玩。

上手试玩demo

在demo界面可以看到,AnimateLCM目前有三个版本,AnimateLCM-SVD-xt是通用图像到视频生成;AnimateLCM-t2v倾向个性化文本到视频生成;AnimateLCM-i2v为个性化图像到视频生成。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

下面是一个配置区域,可以选择基础的Dreambooth模型,也可以选择LoRA模型,并通过滑动条调整LoRA alpha值等。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

接下来可以输入Prompt、负面prompt,指导生成的动画内容和质量:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

还有一些参数可以调整:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

我们上手体验了一把,提示词为“clouds in the sky”,参数设置如上图,采样步骤仅为4步时,生成的效果是这样婶儿的:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

采样步骤为25步时,提示词“a boy holding a rabbit”,效果如下:

爱设计PPT 爱设计PPT

AI快速生成高质量PPT

爱设计PPT 86 查看详情 爱设计PPT

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

再看看一波官方放出的展示效果。2步、4步、8步效果对比如下:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

步数越多,动画质量越好,仅4步AnimateLCM就能做到高保真:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

各种风格都能实现:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

怎么做到的?

要知道,虽然视频扩散模型因能生成连贯且高保真度的视频而受到越来越多的关注,但难题之一是迭代去噪过程不仅耗时而且计算密集,这也就限制了它的应用范围。

而在AnimateLCM这项工作中,研究人员受到一致性模型(CM)启发,该模型简化了预训练的图像扩散模型以减少采样所需的步骤,并在条件图像生成上成功扩展了潜在一致性模型(LCM)。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

具体来说,研究人员提出了一种解耦的一致性学习(Decoupled Consistency Learning)策略。

首先在高质量的图像-文本数据集上蒸馏稳定扩散模型为图像一致性模型,然后在视频数据上进行一致性蒸馏以获得视频一致性模型。这种策略通过在空间和时间层面上分别训练,提高了训练效率。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

此外,为了能够在Stable Diffusion社区中实现即插即用适配器的各种功能(例如,用ControlNet实现可控生成),研究人员又提出了Teacher-Free自适应(Teacher-Free Adaptation)策略,使现有的控制适配器更符合一致性模型,实现更好的可控视频生成。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

定量和定性实验都证明了方法的有效性。

在UCF-101数据集上的零样本文本到视频生成任务中,AnimateLCM在FVD和CLIPSIM指标上均取得了最佳性能。

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

消融研究验证了解耦一致性学习和特定初始化策略的有效:

两步生成25帧高质量动画,计算为SVD的8% | 在线可玩图片

项目链接:
[1]https://animatelcm.github.io/
[2]https://huggingface.co/wangfuyun/AnimateLCM-SVD-xt

以上就是两步生成25帧高质量动画,计算为SVD的8% | 在线可玩的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/621654.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 06:53:05
下一篇 2025年11月11日 06:54:06

相关推荐

  • js动画animation实现_js动画animation效果详解

    js动画animation是用javascript控制网页元素动画效果的技术,它比css动画更灵活。实现简单动画需获取元素、定义关键帧、用requestanimationframe驱动动画、更新属性。复杂动画可通过缓动函数、动画库、状态控制和性能优化提升效果。性能优化技巧包括减少dom操作、使用tr…

    2025年12月4日 web前端
    000
  • CSS中transition和animation实现动画的优缺点

    在网页开发中,transition适合简单状态过渡,animation适合复杂动画控制。transition用于按钮悬停、表单焦点等简单效果,优点是写法简单、性能好,但仅限两状态过渡且不可控过程;animation配合keyframes实现多阶段动画,适用于加载动画、页面动效,优点是控制力强但语法复…

    2025年12月2日 web前端
    000
  • css如何添加动画效果?css动画制作入门教学

    CSS添加动画效果,核心在于transition和animation这两个属性。前者用于简单的状态过渡,后者则可以创建更复杂的动画序列。 解决方案 Transition(过渡): 最简单的动画形式。它定义了CSS属性值在改变时,如何平滑地过渡。 属性: transition-property (指定…

    2025年12月2日 web前端
    000
  • StableDiffusion怎样用LoRA定制画风_StableDiffusion用LoRA定制画风【画风定制】

    通过加载LoRA模型可精准控制Stable Diffusion的生成画风,需将.safetensors文件放入models/loras/目录并重启WebUI;2. 在提示词中使用调用,结合正向提示词描述风格、反向提示词排除干扰,并调整权重值(0.5~1.0)优化效果;3. 可引入Textual In…

    2025年12月2日 科技
    000
  • MVDiffusion:实现高质量多视角图像生成与精确复刻场景材质

    逼真的图像生成在虚拟现实、增强现实、视频游戏和电影制作等领域有广泛应用。 随着近两年来扩散模型的快速发展,图像生成领域取得了重大突破。从Stable Diffusion衍生出的一系列根据文本描述生成图像的开源或商业模型,已经对设计、游戏等领域产生了巨大的影响 然而,如何根据给定的文本或其他条件,产生…

    2025年12月2日 科技
    000
  • ICCV’23论文颁奖“神仙打架”!Meta分割一切和ControlNet共同入选,还有一篇让评委们很惊讶

    在法国巴黎举行的计算机视觉顶峰大会iccv 2023刚刚结束! 今年的最佳论文奖,简直是“神仙打架”。 例如,获得最佳论文奖的两篇论文中,就包括颠覆文生图AI领域的著作——ControlNet。 自从开源以来,ControlNet在GitHub上已经获得了24k个星。无论是对于扩散模型还是整个计算机…

    2025年12月2日 科技
    000
  • ICCV 2023揭晓:ControlNet、SAM等热门论文斩获奖项

    在法国巴黎举行了国际计算机视觉大会ICCV(International Conference on Computer Vision)本周开幕 作为全球计算机视觉领域顶级的学术会议,ICCV 每两年召开一次。 ICCV的热度一直以来都与CVPR不相上下,屡创新高 在今天的开幕式上,ICCV官方公布了今…

    2025年12月2日 科技
    000
  • ICCV 2023宣布ControlNet和「分割一切」等热门论文获奖

    本周,国际计算机视觉大会 ICCV(International Conference on Computer Vision)在法国巴黎开幕。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 作为全球计算机视觉领域顶级的学术会议,ICCV 每两…

    2025年12月2日 科技
    000
  • css选择器在动画和过渡中的作用

    CSS选择器决定动画或过渡作用的元素,如类、ID选择器精准绑定效果,伪类响应交互状态,组合选择器控制触发条件,实现高效流畅的视觉交互。 CSS选择器在动画和过渡中起到关键作用,它决定了哪些元素会应用动画或过渡效果。通过精准选择目标元素,开发者可以控制动画的触发时机、作用范围以及与其他页面行为的交互方…

    2025年12月2日 web前端
    000
  • 如何通过css align-self与animation实现子元素独立动画

    在使用 CSS 的 align-self 和 animation 时,可以让 Flex 或 Grid 容器中的某个子元素独立地改变对齐方式并伴随动画效果。虽然 align-self 本身不能直接被动画化(因为它是离散值,如 flex-start、center、flex-end),但可以通过间接方式实…

    2025年12月2日 web前端
    000
  • mysql常用日期与计算函数实例讲解

    mysql数据库中的日期比较与计算是经常用到的,例如比较两个日期大小,计算两个日期相差多少天,本文主要和大家分享mysql常用日期与计算函数实例,希望能帮助到大家。 unix_timestamp() unix_timestamp 函数可以接受一个参数,也可以不使用参数。 它的返回值是一个无符号的整数…

    2025年12月2日
    000
  • 哩布哩布ai安全访问官网地址_哩布哩布ai平台链接官方首页

    哩布哩布AI安全访问官网地址是https://www.liblib.art/,该平台提供丰富的AI模型资源、在线图像生成功能及个性化LoRA训练服务,支持多种模型类型筛选与云端作品管理。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 哩布哩…

    2025年12月2日 科技
    000
  • css animation-play-state与hover事件结合使用

    答案:使用CSS的animation-play-state属性结合:hover伪类,可实现鼠标悬停暂停动画、移开继续播放的效果,常用于滚动字幕、轮播图等场景。 在CSS中,animation-play-state 属性可以控制动画的运行或暂停。结合 :hover 伪类,我们可以实现“鼠标悬停时暂停动…

    2025年12月2日 web前端
    000
  • 哩布哩布AI怎么加速生成速度_哩布哩布AI排队优化与GPU设置技巧

    优先切换高优先级队列并选择空闲GPU节点,调整分辨率至768×768、采样步数20-30,关闭多余插件,利用早晚低峰时段生成以提升效率。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您在使用哩布哩布AI生成图像时遇到排队时间…

    2025年12月2日 科技
    000
  • 即梦AI怎么控制人物姿势 即梦AI精准控制角色动作方法【攻略】

    使用明确提示词、骨骼映射、预设模板、ControlNet插件及草图功能可精准控制即梦AI角色姿态。1、输入具体动作与身体部位描述,提升识别精度;2、开启姿态控制并上传参考图提取骨架,调整关键点与强度;3、选用“舞蹈”“战斗”等分类下的预设模板编号快速调用标准动作;4、安装ControlNet插件,加…

    2025年12月2日 科技
    000
  • 在css中animation与vw vh单位动画

    vw 和 vh 是相对于视口宽高的单位,1vw 等于视口宽度的1%,1vh 等于高度的1%。结合 CSS animation 可创建响应式动画,如使用 left: -100vw 实现全屏滑入效果,或用 top: 70vh 制作垂直浮动提示。适用于滑动入场、背景流动等场景。需注意移动浏览器对 vh 解…

    2025年12月2日 web前端
    000
  • ChatGPT怎样用图像生成配合文案_ChatGPT用图像生成配合文案【图文创作】

    先明确优化提示词结构可提升图文匹配度,再分步生成并校对一致性,最后联动外部工具精细调整,确保图像与文案在场景、情感和细节上精准契合。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您在使用ChatGPT进行图文创作时发现生成的图像与文案…

    2025年12月2日 科技
    100
  • 有手就行!PS全新工具实现“对话式P图” AI应用风口已然到来

    ai即将淘汰哪个行业?在midjourney、dall-e等一众ai绘图模型的爆火下,传统的设计行业一度陷入了“人人自危”的境地。生产力跃迁革命近乎不可逆,设计软件龙头adobe photoshop(下文简称:ps)选择了“革自己的命”。 最近,PS的测试版中发布了最新的生成式AI绘图工具Gener…

    2025年12月2日 科技
    000
  • 生成式AI的花园里 英伟达如何做“挖掘工”

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 英伟达的GPU为什么昂贵? 作者:江月 编辑:陶力 卢陶然 图源:图虫 “CPU扩张的时代已经过去了”是英伟达创始人兼CEO黄仁勋在5月29日台北国际电脑展上宣布的话。”…

    2025年12月2日 科技
    000
  • 吴恩达新课三连发,手把手教你用ChatGPT API构建应用

    吴恩达又给AI社区送福音了。 今日,吴恩达在推特上宣布三门新的生成式AI课程上线。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 这三门课包括—— 1. 使用OpenAI的ChatGPT API构建系统:通过这门课,可以超越单个提示,学习构…

    2025年12月2日 科技
    000

发表回复

登录后才能评论
关注微信