follow
-
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@ji…
-
营销效果大幅提升,AIGC视频创作就该这么用
经过一年多的发展,aigc 已经从文字对话、图片生成逐步向视频生成迈进。 回想四个月前,Sora 的诞生让视频生成赛道经历了一场洗牌,大力推动了 AIGC 在视频创作领域的应用范围和深度。 在人人都在谈论大模型的时代,我们一方面惊讶于视频生成带来的视觉震撼,另一方面又面临着落地难问题。诚然,大模型从…
-
史上首个实时AI视频生成技术:DiT通用,速度提升10.6倍
dit 都能用,生成视频无质量损失,也不需要训练。 实时 AI 视频生成来了! 本周三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于 DiT 的视频生成方法。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 该技术名为 Pyra…
-
像生物网络一样「生长」,具备「结构可塑性」的自组织神经网络来了
生物神经网络有一个重要的特点是高度可塑性,这使得自然生物体具有卓越的适应性,并且这种能力会影响神经系统的突触强度和拓扑结构。 然而,人工神经网络主要被设计为静态的、完全连接的结构,在面对不断变化的环境和新的输入时可能非常脆弱。尽管研究人员对在线学习和元学习进行了大量研究,但目前最先进的神经网络系统仍…
-
换了30多种方言,我们竟然没能考倒中国电信的语音大模型
不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒…… 某种意义上说,方言不只是一种语言习惯,也是一种情感连接、一种文化认同。我们「上网冲浪」遇到的新鲜词汇中,有不少就是来自各地方言。 当然,有些时候,方言也是一种交流「壁垒」。…
-
又一Sora级选手来炸街!我们拿它和Sora、可灵PK了下
当sora「千呼万唤」不出来时,openai 的对手们却纷纷祭出大杀器来炸街。 Sora 再不开放使用,真的要被偷家了! 今日,旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine。人人免费可用。 据介绍,该模型能够根据简单的文本描述生成高质量、逼…
-
Gemini 1.5 Pro装进机器人,参观一遍公司就能礼宾、带路
长上下文大模型帮助机器人理解世界。 最近,谷歌 DeepMind 突然开始炫起了机器人。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 新CG儿 数字视觉分享平台 | AE模板_视频素材 412 查看详情 这个机器人可以轻松听从人类指令、进…
-
AI在用 | 爆改工位文案,大模型也疯狂
机器之能报道 编辑:Sia 工牌也能疯。 还记得篇篇 10万+ 的打工人 「发疯」文案么? 喜欢各种爆改的年轻人,最近又开辟了「工位精装修」新赛道。 作为打工人每天停留最长甚至是「唯二」停留的地方,爆改可以提供「情绪价值。」 除了置办各种潮玩和手办,爆改工位文案也成了新热点。 赵钱孙李、周吴郑王、…
-
小红书这场大模型论文分享会,集齐了四大国际顶会的作者
大模型正引领新一轮的研究热潮,业界和学术界都涌现出了众多的创新成果。 小红书技术团队也在这一浪潮中不断探索,多篇论文研究成果在 ICLR、ACL、CVPR、AAAI、SIGIR、WWW 等国际顶会上频频亮相。 在大模型与自然语言处理的交汇处,我们发现了哪些新机遇和挑战? 对于大模型,有哪些有效的评测…
-
离开OpenAI待业的Karpathy做了个大模型新项目,Star量一日破千
没工作也要「卷」。 闲不下来的 Andrej Karpathy 又有了新项目! 过去几天,OpenAI 非常热闹,先有 AI 大牛 Andrej Karpathy 官宣离职,后有视频生成模型 Sora 撼动 AI 圈。 在宣布离开 OpenAI 之后,Karpathy 发推表示「这周可以歇一歇了。」…