follow
-
Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成
音频生成领域又有好消息:刚刚,stability ai 宣布推出开放模型 stable audio open,该模型能够生成高质量的音频数据。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 项目地址:https://huggingface.…
-
辅导作业这么费劲的事,还是交给这个大模型吧
“小思”是学而思学习机的人格化,代表整个学习机以拟人化的方式与孩子交互。 辅导孩子作业已成为中国大部分家长的常态。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 每一份令人啼笑皆非的作业的背后,都有一位濒临崩溃的父亲或者母亲。 明星,又…
-
腾讯混元联合港科大及清华推出「Follow Your Emoji」, 一键让照片变表情包
图生视频又有新玩法。 腾讯混元联合港科大、清华大学联合推出肖像动画生成框架“Follow Your Emoji”,可以通过人脸骨架信息生成任意风格的脸部动画。基于算法革新和数据积累,“Follow Your Emoji”可以支持对脸部进 行精细化的控制,包括眉毛、眼睛、翻白眼等细节,动物表情包也可以…
-
让鲁迅说绕口令、赫本玩嘻哈,又一视频模型火了,斯坦福华人博士创立
团队成员均来自斯坦福大学,CTO还是泰勒·斯威夫特的铁杆粉丝。 AI视频领域卷疯了。 Luma引发的狂欢还没结束,AI视频圈又来了个挑战者—— 斯坦福大学团队出品的Proteus。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 据介绍,Pr…
-
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@ji…
-
营销效果大幅提升,AIGC视频创作就该这么用
经过一年多的发展,aigc 已经从文字对话、图片生成逐步向视频生成迈进。 回想四个月前,Sora 的诞生让视频生成赛道经历了一场洗牌,大力推动了 AIGC 在视频创作领域的应用范围和深度。 在人人都在谈论大模型的时代,我们一方面惊讶于视频生成带来的视觉震撼,另一方面又面临着落地难问题。诚然,大模型从…
-
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
dit 都能用,生成视频无质量损失,也不需要训练。 实时 AI 视频生成来了! 本周三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于 DiT 的视频生成方法。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 该技术名为 Pyra…
-
像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了
生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构。 然而,人工神经网络主要被设计为静态的、完全连接的结构,在面对不断变化的环境和新的输入时可能非常脆弱。尽管研究人员对在线学习和元学习进行了大量研究,但目前最先进的神经网络系统仍…
-
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。 当然,有些时候,方言也是一种交流「壁垒」。…
-
又一Sora级选手来炸街!我们拿它和Sora、可灵PK了下
当sora「千呼万唤」不出来时,openai 的对手们却纷纷祭出大杀器来炸街。 Sora 再不开放使用,真的要被偷家了! 今日,旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine。人人免费可用。 据介绍,该模型能够根据简单的文本描述生成高质量、逼…