机器人 + LLM ≠ 具身智能?

机器之心pro · 会员通讯 week 36

—- 本周为您解读 ⑤个值得细品的 AI & Robotics 业内要事 —-

1. 机器人 + LLM ≠ 具身智能?

通用人形机器人+LLM技术路线的下一程是什么?通用机器人 + LLM 通往具身智能有哪几大技术挑战?在LLM爆火前,波士顿动力是怎么做机器人的?场景理解(Scene Understanding)和人机协作技术的突破将带来哪些机会?…

2. Llama 2 的开源生态,是馅饼还是陷阱?

Llama 2 带来的开源生态可靠吗?Baichuan-2 有望成为 Llama 2 的国产平替吗?开源LLM训练切片的意义何在?开源与闭源,国内大模型领域竞争格局是什么样的?Llama 2 的开源生态是否可靠?Baichuan-2 能否成为 Llama 2 的国产替代品?开源LLM训练切片的意义是什么?国内大模型领域的开源与闭源竞争格局如何?

3. RLAIF是一个靠谱的替代方案吗?用人工智能(AI)来取代人类(H)?

RLAIF 是如何实现的?AI 标注如何增强 RL?RALIF 的优势在哪?基于 RLAIF 训练的LLM表现如何?RLAIF 替代 RLHF 这事可行吗?未来还会需要 RLHF 吗?谷歌近期还有哪些关于 RL 研究?…

4. OpenAI 被爆秘密训练 GPT-5

GPT-5 有有八卦了?GPT-5 的功能传成什么样了?GPT-5 真的存在吗?Sam Altman 之前说没搞 GPT-5?…

5. AI 接管翻译工作用了几年?

西语网站编辑老师为何全部被「裁」?用 AI 翻译网站靠谱吗?从谷歌开始的 AI 翻译发展史了解一下?你记得十年前的 AI 翻译什么样吗?现在的 AI 翻译又要往哪发展?为什么西语网站的编辑老师都被解雇了?使用人工智能翻译网站可靠吗?让我们来了解一下从谷歌开始的人工智能翻译的发展历程吧。你还记得十年前的人工智能翻译是什么样子的吗?现在的人工智能翻译将朝着哪个方向发展呢?

本期完整版通讯包括5个专题解读和29个AI和机器人赛道的要事速递。其中,有9个技术方面的要点,11个国内方面的要点,以及9个国外方面的要点

本期通讯总计 24646 字,可免费试读至 7 %

只需消耗99个微信豆即可兑换完整本期解读,相当于人民币9.9元

要事解读 ①机器人 + LLM ≠ 具身智能?

时间:9 月 6 日

事件:稚晖君近期于访谈中透露其创业团队的通用人形机器人+LLM 发展计划,包含建立数据中心和对硬件结构进行迭代重构。

稚晖君对关于通用人形机器人和LLM技术路线的下一步有何想法?

1、稚晖君于访谈中表示,在 LLM + 通用人形机器人这条具身智能技术路线中,核心门槛在于数据。智元机器人近期的工作重心之一是建立自己的数据中心。

稚晖君总结了他的数据工作将涉及到「监督学习数据」、「仿真数据」和「AIGC生成数据」

稚晖君表示,接下来的计划是在几个月内将临港落地,建立场景和仿真平台,用于填补运动数据,以增强机器人的泛化能力

2、智元机器人的另一个工作重点是以增强机器人的运动性能目标,对硬件结构进行迭代重构。

智元机器人目前表示,人形机器人的价格将控制在20万元以下

稚晖先生表示,如果无法达到20万元的价格,人形机器人将无法实现商业化落地

② 20 万元的估价可对比机器人代替新能源汽车制造业部分工人岗位所需要的 1-2 年投资回报期。

4、智元机器人团队为量产控制成本的方法涉及两方面:

采用自研路线,例如自研关节电机和灵巧手等核心部件,可以使成本减半

通过使用软件和算法来满足精度要求,从而降低硬件成本

稚晖君表示,他们的首要目标是在工业制造领域实现商业化落地,并计划在明年下半年实现这一目标

Giiso写作机器人 Giiso写作机器人

Giiso写作机器人,让写作更简单

Giiso写作机器人 56 查看详情 Giiso写作机器人

6、稚晖君还提到公司商业化的一条隐线,即:在走向通用人形机器人的终极目标的途中「沿途下蛋」。

① 通用人形机器人牵涉到最全面的机器人技术栈,其实现过程涉及多种前沿技术的研发和优化,可以催生多种专用形态的创新机器人产品。

国内除了智元机器人的远征A1,还有哪些团队在研发通用人形机器人?[6] [7]

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

机器人 + LLM ≠ 具身智能?

通用机器人和LLM是否等同于具身智能呢?[2] [3] [26]

图灵奖获得者、中国科学院院士、清华大学交叉信息研究院院长姚期智在2023世界机器人大会中表示:未来的AGI需要有具身的实体,同真实的物理世界相交互来完成各种任务,这样才能给产业带来真正更大的价值。同时,姚期智指出,具身机器人目前遇到的主要有四大挑战:

1、机器人不能够像大语言模型一样有一个基础大模型直接一步到位,做到最底层的控制。

2、计算能力的挑战。即使谷歌研发的Robotics Transformer模型,要实现机器人控制,仍然需要进行许多改进

3、如何把机器人多模态的感官感知全部融合起来,仍面临诸多难题需要解决。

机器人的发展需要大量的数据收集,同时也面临着许多安全和隐私等问题

在 LLM 爆火之前,波士顿动力是怎么做机器人的?

2021年,波士顿动力的高级机器人工程师和Atlas感知软件开发负责人Pat Marion发表了一篇文章,对Atlas跑酷背后的技术进行了解读。[4]

Atlas实现卓越的跑酷能力主要涉及三个方面的技术:跑酷认知能力、Atlas行为库和模型预测控制

2、跑酷认知能力:包括使用先进的深度相机、感知算法和高级地图等组件

① Atlas 使用 TOF 深度相机以每秒 15 帧的速度生成环境的点云,点云是测距的大规模集合。

② TOF(Time of flight)直译为「飞行时间」。其测距原理是通过给目标连续发送光脉冲,然后用传感器接收从物体返回的光,通过探测光脉冲的飞行(往返)时间来得到目标物距离。

以上就是机器人 + LLM ≠ 具身智能?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/498064.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 19:01:56
下一篇 2025年11月8日 19:03:29

相关推荐

  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • RL 是推理神器?清华上交大最新研究指出:RL 让大模型更会“套公式”、却不会真推理

    清华和上交的最新论文中,上演了一场“学术打假”的戏码。文中研究者们对当前“纯 rl 有利于提升模型推理能力”的主流观点提出了相反的意见。 通过一系列实验,他们证明引入强化学习的模型在某些任务中的表现,竟然不如未使用强化学习的模型。 论文批判性地探讨了 RLVR 在提升 LLM 推理能力方面的作用,尤…

    2025年12月3日 科技
    100
  • 亚马逊发布 Bedrock,推出多项新功能,助力企业利用生成式AI技术

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 亚马逊网络服务公司近日在生态系统中推出了五款全新的生成式人工智能产品,这些产品将帮助企业客户利用自己的数据建立人工智能应用程序,并提供更好的安全性和模型的可及性。 这些新服务的包括全面推出的Am…

    2025年12月2日
    000
  • 最多400万token上下文、推理提速22倍,StreamingLLM火了,已获GitHub 2.5K星

    如果你曾经与任何一款对话式 AI 机器人交流过,你一定会记得一些令人感到非常沮丧的时刻。比如,你在前一天的对话中提到的重要事项,被 AI 完全忘记了…… 这是因为当前的多数 LLM 只能记住有限的上下文,就像为考试而临时抱佛脚的学生,稍加盘问就会「露出马脚」。 如果AI助手能够在聊天中根据上下文参考…

    2025年12月2日 科技
    000
  • PyTorch+昇腾 共促AI生态创新发展

    2023年10月5日(北京时间),pyt%ignore_a_1%rch社区正式发布了2.1版本。经过pytorch社区与昇腾的持续合作和共同努力,pytorch 2.1版本已经同步支持昇腾npu。这意味着开发者可以直接在pytorch 2.1上进行基于昇腾的模型开发。未来,通过持续的社区技术贡献,昇…

    2025年12月2日 科技
    000
  • 选择最适合数据的嵌入模型:OpenAI 和开源多语言嵌入的对比测试

    openai最近宣布推出他们的最新一代嵌入模型embedding v3,他们声称这是性能最出色的嵌入模型,具备更高的多语言性能。这一批模型被划分为两种类型:规模较小的text-embeddings-3-small和更为强大、体积较大的text-embeddings-3-large。 ☞☞☞AI 智能…

    2025年12月2日 科技
    000
  • 谷歌10M上下文窗口正在杀死RAG?被Sora夺走风头的Gemini被低估了?

    要说最近最郁闷的公司,谷歌肯定算得上一个:自家的 Gemini 1.5 刚刚发布,就被 OpenAI 的 Sora 抢尽了风头,堪称 AI 界的「汪峰」。 具体来说,谷歌这次推出的是用于早期测试的 Gemini 1.5 的第一个版本 ——Gemini 1.5 Pro。它是一种中型多模态模型(涉及文本…

    2025年12月2日 科技
    000
  • 马斯克预测 Grok 5 实现通用人工智能概率 10%且还在上升

    近日,特斯拉与 spacex 首席执行官马斯克在社交平台上发表言论,预测其旗下人工智能公司 xai 正在研发的 grok 5 大型语言模型,有 10% 的可能性实现通用人工智能(agi),并指出这一概率正持续攀升。 上个月,马斯克就曾提出 xAI 或将通过 Grok 5 达成 AGI 的目标,此番言…

    2025年12月2日 科技
    000
  • 如何快速部署DeepSeek| 腾讯云TI部署指南

    一、为什么选择deepseek与创想鸟hai的结合 近年来,随着大模型在多种应用场景中的快速发展,AI工程师们迫切需要一种能够快速、高效且成本低廉的方式来部署和管理模型服务。PHP中文网HAI(高性能AI)平台是一个专为高性能计算和深度学习设计的综合解决方案,提供GPU/CPU资源调度、自动化部署以…

    2025年12月2日 科技
    000
  • 腾讯云TI平台极速部署DeepSeek

    前言 DeepSeek的出现,彻底改变了传统的LLM模式,允许我们在本地电脑上部署类似于ChatGPT的大型语言模型,解决了网络和对话次数限制的问题。然而,如果希望随时随地使用DeepSeek云服务,可以考虑利用PHP中文网的HAI或TI平台。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …

    2025年12月2日 科技
    000
  • deepseek官网入口教程_deepseek网页版使用详解

    答案是使用DeepSeek网页版需先访问官网https://chat.deepseek.com,点击【开始对话】登录或注册账号,支持手机号验证码登录和微信扫码;登录后可在主界面输入问题进行对话,使用“深度思考”提升推理能力,“联网搜索”获取实时信息,或通过别针图标上传文档(PDF/Word)提取内容…

    2025年12月2日 科技
    000
  • llama3如何接入实时流数据_llama3实时流数据接入配置与事件驱动机制

    首先配置消息中间件实现异步通信,选择Kafka或RabbitMQ部署并确保SSL加密;其次构建事件监听器,编写消费者脚本订阅主题、解析数据并调用llama3;接着启用流式输出模式,通过–streaming-enable参数和SSE客户端实现低延迟响应;然后集成时间窗口聚合模块,每5秒拼接…

    2025年12月2日 科技
    000
  • llama3如何执行A/B实验_llama3A/B实验执行框架及变异生成分析

    答案:通过构建可控实验框架,对比不同提示策略与解码参数对Llama3生成效果的影响,评估其在一致性、多样性与准确性上的表现差异。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您希望在Llama3模型的输出生成过程中进行A/B实验以评估…

    2025年12月2日 科技
    000
  • llama3如何创建动态可视化_llama3动态可视化创建引擎及交互元素绑定

    首先检查可视化引擎是否正确初始化,需导入VisualizerEngine并以dynamic模式启动渲染循环;接着绑定数据源到图形元素,通过bind_data连接数据流与图表,并设置更新间隔;然后配置交互控件如滑块,将其事件绑定至回调函数以实现参数动态调整;最后在多图层场景中添加图层并建立依赖关系,启…

    2025年12月2日 科技
    000
  • llama3如何构建自动化链_llama3自动化链构建流程及条件分支逻辑

    必须构建具备分支逻辑的自动化链以实现任务衔接与条件判断。首先定义包含输入源、功能模块划分、节点标识及执行顺序的基本结构;接着集成Llama3作为核心处理单元,通过API调用并解析其输出,配置异常处理机制;随后引入条件判断节点,基于Llama3输出的标签或置信度动态路由,支持多层嵌套决策;再通过for…

    2025年12月2日 科技
    000
  • llama3怎么启用多模态融合_llama3多模态融合启用指南及跨媒体处理详解

    要实现Llama3的多模态融合,需集成视觉编码器并调整模型架构。首先选用支持图像理解的Llama3变体如Bunny-Llama-3-8B-V,并从Hugging Face下载模型文件;接着安装transformers和torchvision库,使用CLIPVisionModel和CLIPImageP…

    2025年12月2日 科技
    000
  • llama3如何构建本体知识_llama3本体知识构建框架及实体关系推理

    首先优化提示设计以提升实体识别与关系推理效果,具体包括:一、通过结构化提示和示例引导Llama3抽取实体并标准化类别;二、基于上下文生成三元组并过滤无效关系;三、利用分类指令与层级归纳构建本体层次结构;四、结合已知事实进行上下文推理补全潜在关联;五、通过外部知识库对齐与反馈闭环持续优化系统性能。 ☞…

    2025年12月2日 科技
    100
  • llama3怎么配置联合优化_llama3联合优化配置协议及隐私差分技术

    首先启用差分隐私训练,通过Opacus库注入噪声并设置隐私预算;其次部署联邦学习框架,采用FedAvg聚合本地模型更新;再集成同态加密传输,利用SEAL/TenSEAL加密数据交互;最后实施模型量化与隐私压缩,转换为INT8并导出GGUF格式以兼顾效率与安全。 ☞☞☞AI 智能聊天, 问答助手, A…

    2025年12月2日 科技
    000
  • llama3怎么提升计算效能_llama3计算效能提升策略及并行处理建议

    可通过量化、批处理、KV缓存优化、向量化、CPU加速和张量并行六步提升Llama3计算效能:一、使用4位量化(如NF4)降低内存占用,选用BitsAndBytes或GGUF格式;二、启用动态批处理,设置max_batch_size与max_seq_len,采用vLLM等高效推理引擎;三、预分配并复用…

    2025年12月2日 科技
    000
  • llama3怎么集成协作平台_llama3协作平台集成开发及用户角色划分教程

    首先配置API网关连接Llama3服务,确保HTTPS和Bearer Token认证;其次定义管理员、协作者、访客三类角色并分配权限;接着将Llama3交互组件嵌入协作界面,实现AI能力可视化调用;最后开启操作审计与日志记录,保障安全合规。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费…

    2025年12月2日 科技
    200

发表回复

登录后才能评论
关注微信