视频生成_创想鸟

视频生成可以无限长？谷歌VideoPoet大模型上线，网友：革命性技术

蒙娜丽莎打哈欠，小鸡学会举铁……谷歌videopoet大模型表现很亮眼。 2023 年底，科技公司都在冲击生成式 AI 的最后一个关卡 —— 视频生成。本周二，谷歌提出的视频生成大模型上线，立刻获得了人们的关注。这款名为 VideoPoet 的大语言模型，被人们认为是革命性的 zero-shot …

程序猿

2025年12月1日 • 用户投稿

0000

本地AI视频软件部署 | AI视频生成快速上手指南

首先检查系统环境并安装必要依赖，再获取ComfyUI程序，接着安装视频生成模型与插件，最后构建图生视频工作流。具体步骤包括：确认操作系统为64位Windows 10/11或Ubuntu 20.04以上；安装Python 3.10和Git工具；通过pip命令安装支持CUDA的PyTorch 2.1.0…

程序猿

2025年11月29日 • 用户投稿

0000

Luma、Runway轮番炸场，视频生成卷出新高度，Sora还能称霸吗？来这场WAIC视频生成论坛寻找答案

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2023 年 pika 发布时，马斯克曾论断称 2024 年将是「人工智能电影」元年。年初 Sora 惊艳亮相、大杀四方，接着 Stable Video Diffusion 、LTX Stud…

程序猿

2025年11月26日 • 用户投稿

2000

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

dit 都能用，生成视频无质量损失，也不需要训练。实时 AI 视频生成来了！本周三，新加坡国立大学尤洋团队提出了业内第一种可以实时输出的，基于 DiT 的视频生成方法。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 该技术名为 Pyra…

程序猿

2025年11月26日 • 用户投稿

1000

音频驱动人像视频模型：字节Loopy、CyberHost研究成果揭秘

近期，来自字节跳动的视频生成模型 Loopy，一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频，对声音中呼吸，叹气，挑眉等细节都能生成的非常自然，让网友直呼哈利波特的魔法也不过如此。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使…

程序猿

2025年11月26日 • 用户投稿

2000

用户投稿

GoogleAI怎么用视频生成新闻稿_GoogleAI视频生成新闻稿写作教程

答案：可通过Google Veo 3生成视频，结合Imagen 4识别关键帧并由Vertex AI调用语言模型自动生成新闻稿。具体流程为：在Opal平台用提示词生成含语音画面的视频；提取帧图像并用Imagen 4分析场景与动作；将多帧描述输入Vertex AI集成的语言模型，生成结构完整、约500字…

程序猿

2025年11月25日

1000

语音变文案再转视频？AI语言多功能整合流程全解析

语音转视频流程分为三步：语音识别、文案优化、视频生成。首先用asr工具（如whisperx、funasr）将语音转为带时间戳的文字稿，需注意语速与清晰度并支持多语言；其次删减冗余内容、调整逻辑结构并标注关键词，提升文案紧凑度；最后通过ai工具自动生成视频模板、同步tts配音并添加字幕，实现图文声像一…

程序猿

2025年11月11日 • 用户投稿

0000

再谈复现 Sora：被仰望与被遗忘的

2月16日，OpenAI 发布了视频生成领域的重磅模型 —— Sora。 Sora 对 Scaling Law 的信仰及其突破性的技术创新，使它持续保持领先地位。同时，也再次证明了“大力出奇迹”依然适用于文生视频领域。 Sora 披露的技术细节，远远不足以窥其全貌。同时 Sora 目前也未正式对外开…

程序猿

2025年11月11日 • 用户投稿

0000

WorldGPT来了：打造类Sora视频AI智能体，「复活」图文

openai 的 sora 在今年 2 月惊艳亮相，为文本生成视频带来了全新的突破。它可以根据文字输入创作出仿佛来自好莱坞的逼真且充满想象力的影片，让人叹为观止。许多人都对这一创新赞叹不已，认为openai 的表现实现了巅峰之作。 Sora引发的热潮持续不减，同时研究者们也开始认识到AI视频生成技术…

程序猿

2025年11月7日 • 用户投稿

1000

无需训练，即插即用，2倍GPU端到端推理加速——视频扩散模型加速方法DraftAttention

本文第一作者为美国东北大学博士生沈轩，研究方向为高效人工智能，专注于在 gpu、移动端、fpga 与 asic 等多种硬件平台上实现大模型的高效部署与加速。第二作者为香港中文大学的韩晨夏，其研究聚焦于计算机体系结构与 ai 系统的高效化设计。在高质量视频生成任务中，扩散模型已成为主流技术。然而，随…

程序猿

2025年11月6日 • 用户投稿

0000