模型
-
两张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora
只需2张图片,无需测量任何额外数据—— 当当,一个完整的3D小熊就有了: ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。 有网友实测,拍两张照片,真的就重建…
-
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4
本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。 据介绍,Inflection-2.5将结合强大的LLM技术和Inflection独有的“同理心微调”特性,综合了高情商和高智商的特点。它可以通过联网获取事实信息,性能媲美GPT-4和G…
-
40%算力训练效果比肩GPT-4,实测DeepMind联创大模型创业新成果
大模型竞赛,又杀出一匹黑马—— Inflection-2.5,由DeepMind联创Mustafa Suleyman的大模型初创公司打造。 只用40%的计算资源训练,表现就超过了GPT-4的九成,尤其擅长代码和数学。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSe…
-
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹
设想一下,当你站在房间内,准备向门口走去,你是通过自回归的方式逐步规划路径吗?实际上,你的路径是一次性整体生成的。 最新研究指出,利用扩散模型的规划模块可以同时生成长序列的轨迹规划,更符合人类的决策方式。此外,扩散模型在策略表征和数据合成方面还能为现有的决策智能算法提供更为优化的方案。 来自上海交通…
-
GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线
OpenAI的GPT-4.5 Turbo提前泄露了? 就在今天,网友纷纷发现,一款号称是GPT-4.5 Turbo的模型,竟然同时出现在了Bing、谷歌、DuckDuck Go的搜索结果里! 介绍信息显示:GPT-4.5 Turbo是OpenAI到目前为止推出的速度最快、准确度最高、可扩展性最强的模…
-
OpenAI大模型上身机器人,原速演示炸场!
openai大模型加持的机器人,深夜来袭! 名曰Figure 01,它能听会说,动作灵活。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 能和人类描述眼前看到的一切: 我在桌子上看到一个红色的苹果,沥水架上还摆放着几个盘子和一个杯子;你站在…
-
腾讯机器人研究登顶刊!能帮程序员安显示器,像真人一样协同干活
国产机器人新突破: 两只各自独立的机械臂,已经可以丝滑地打配合了! 不信你看这双手拧瓶盖: ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 拧完再端起杯子倒水: 活灵活现,如真人。 呐,还能搭把手帮程序员安装好显示屏: 甚至接过“同事”手里的…
-
详解Latte:去年底上线的全球首个开源文生视频DiT
随着 Sora 发布成功,视频 DiT 模型引起了广泛关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域研究的重点。DiT 模型的成功为图像生成的规模化带来了新的可能性。 然而,由于视频数据的高度结构化和复杂性,将 DiT 扩展到视频生成领域是一项具有挑战性的任务。一支由上海人工智能实验室的研…
-
LLM性能最高60%提升!谷歌ICLR 2024力作:让大语言模型学会「图的语言」
在计算机科学领域,图形结构由节点(代表实体)和边(表示实体之间的关系)构成。 图无处不在。 互联网可以被视为一个庞大的网络,搜索引擎利用图形化的方式来组织和展示信息。 LLMs主要在常规文本上训练,因此将图转化为LLMs可理解的文本是一项具有挑战性的任务,因为图结构与文本有着根本的不同。 在ICLR…
-
DifFlow3D:场景流估计新SOTA,扩散模型又下一城!
原标题:difflow3d: toward robust uncertainty-aware scene flow estimation with iterative diffusion-based refinement 论文链接:https://arxiv.org/pdf/2311.17456.p…