AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

一群机械臂手忙脚乱地自己干活,彼此配合、互不碰撞

科幻大片场景真的走入现实了。优雅,实在是优雅。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

△视频中为 4 个机械臂,在仿真环境下 4 个安装在桌子上,另外 4 个安装在天花板上。

这就是发表在 Science 子刊Science Robotics上,由 DeepMind、Intrinsic AI 和 UCL 等研究机构共同提出的最新成果——RoboBallet(机器芭蕾)。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

RoboBallet 创新性地将图神经网络(GNN)用于强化学习,作为其策略网络和状态 – 动作价值估计,以解决多机器人(机械臂)协作运动规划中的复杂问题。

这一方法最多可以同时控制8个机械臂,协调多达56个自由度的配置空间,并处理多达40个共享任务, 每一步规划仅需0.3毫秒,且任务分配和调度完全不受约束。

值得一提的是,这篇论文的通讯作者——Matthew Lai,可谓是谷歌 DeepMind 的资深研究员。自 2016 年加入谷歌 DeepMind 以来,他曾参与过AlphaGo、AlphaZero等明星项目。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

总的来说,RoboBallet 的核心是把图神经网络与强化学习结合起来,采用图神经网络(GNN)作为策略网络和状态 – 动作价值估计,解决了大规模多机器人任务分配、调度和运动规划的联合问题,实现了在计算上高效、可扩展且能零样本泛化的高质量轨迹规划。

具体来说,在现代自动化制造中,核心挑战在于如何让多个机器人在共享的、充满障碍物的空间中无碰撞地高效协作,以完成大量任务(如焊接、装配等)。

这涉及到三个高度复杂的子问题:

任务分配(Task Allocation):决定哪个机器人执行哪个任务,以最小化总执行时间。

任务调度(Task Scheduling):决定任务的执行顺序。

运动规划(Motion Planning):在关节空间中寻找一条无碰撞路径,使机器人末端执行器移动到目标姿态。

这三个子问题一组合,复杂度急剧增加,传统算法在真实场景中往往难以计算可行解,工业界目前主要依赖耗时且劳动密集的人工规划。

因此,为了应对这种高维复杂性,RoboBallet 就被用来在随机生成的环境中进行任务和运动规划,其能够为与训练期间所见环境不同的环境(具有任意障碍物几何形状、任务姿态和机器人位置)规划多臂抓取轨迹。

为了实现这一点,RoboBallet 在数据表示层面,创新性地将整个场景建模为图结构。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

其中,图中的节点代表场景中的核心实体,包括机器人、任务和障碍物,而边(Edge)则表示这些实体之间的关系(例如,相对姿态)。

机器人节点之间存在双向边,以支持相互协调和避碰。而任务节点和障碍物节点到机器人节点则存在单向边,用于向机器人传递规划所需的环境信息(如图 c)

接下来,RoboBallet 使用图神经网络(GNN)作为策略网络,通过权重共享来处理不断变化的图大小。其以观测图作为输入,并在每个时间步为所有机器人生成指令关节速度。这使得机械臂能够在只接收原始状态作为输入的情况下,进行关系和组合推理。

而在具体的策略学习和评估阶段,RoboBallet 通过微调 TD3(Twin-Delayed Deep Deterministic Policy Gradient)算法来训练策略网络,使模型能够生成多机械臂轨迹,同时解决任务分配、调度和运动规划等子问题,使得昂贵的在线计算转移到了离线训练阶段。

(注:在此任务中,机械臂因成功解决任务和避免碰撞而获得奖励)

同时,为了解决稀疏奖励的问题,RoboBallet 还采用了Hindsight Experience Replay方法,使模型能够在没有人工设计的奖励函数的情况下高效学习。

在具体的部署方面,RoboBallet 使用Franka Panda的七自由度机械臂、在随机障碍物和任务的模拟环境进行训练。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

为了验证性能,研究团队在一个包含 4(8)个机器人、40 个任务和 30 个障碍物的模拟工作单元中进行测试,并与 RRT-Connect 方法进行比较。值得一提的是,这一切都只需在一块 GPU(图形处理单元)上完成,无论是真实的还是模拟的多臂工作单元。

实验表明,RoboBallet 在多个关键指标上表现出色:

在训练时间的扩展性方面,即使任务数量增加四倍,RoboBallet 收敛所需的训练步数也只是略有增加。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

在规划速度方面。实验表明,在推理阶段,即便是包含 8 个机器人和 40 个任务的最大场景,每个规划步在 NVIDIA A100 上只需约0.3 毫秒,能够实现10 Hz 时间步下超过 300 倍的实时规划速度。

在单个 Intel Cascade Lake CPU 核心上,每个步长大约需要 30 毫秒,在 10Hz 时间步下仍比实时快约 3 倍。每个规划步骤包括对整个场景进行一次推理和一次碰撞检测。

在多智能体协同方面,随着机器人数量从 4 个增加到 8 个 ,平均执行时间减少了约60%。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

而在泛化性方面,模型在随机生成的环境中训练后,无需额外训练即可零样本迁移(zero-shot)到具有不同机器人位置、障碍物几何形状和任务姿态的新环境中。

最后,RoboBallet 的高速和可扩展性使其能够应用于工作单元布局优化(将任务执行时间缩短了 33%)、容错规划和基于在线感知的重新规划等新能力。

AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊

参考链接

[ 1 ] https://x.com/GoogleDeepMind/status/1965040645103407572

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

— 完 —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

最新最专业的 AI 产品信息及分析

不定期发放的热门产品内测码

内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

以上就是AlphaGo 作者领衔,8 个机械臂协同干活 0 碰撞,DeepMind 新作登 Science 子刊的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/195875.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月1日 18:20:10
下一篇 2025年11月1日 18:21:00

相关推荐

  • btc、eth是不是涨不动了?为啥8月没形成上涨趋势

    BTC、ETH未涨是因四重力量制衡:ETF买盘抵消早期抛售、DeFi去杠杆致刚性抛压、衍生品市场分裂、高稳定币收益吸走流动性,叠加PPI数据冲击引发清算,当前为牛市过渡期,需待宏观与技术突破。 BTC、ETH是不是涨不动了?为啥8月没形成上涨趋势 8月加密货币市场呈现显著的横盘震荡,比特币与以太坊未…

    2025年12月9日
    000
  • 8月底币圈超级大牛市可能爆发吗

    8月底前“超级大牛市”全面爆发概率约40%,市场处于蓄势阶段,短期受制于流动性压力与技术回调,但中长期格局向好,需关注比特币站稳12万美元、以太坊突破4868美元及美联储降息预期三大信号,当前更可能呈现ETH突破与山寨币轮动的结构性机会。 8月底币圈超级大牛市可能爆发吗? 综合市场动态与机构分析,8…

    2025年12月9日
    000
  • 币圈今年下半年特大牛市可能爆发吗

    今年下半年加密货币市场存在爆发特大牛市的可能性,机构资金涌入、宏观流动性宽松及比特币减半周期推动下,市场具备结构性上涨动力,但需警惕监管变化、情绪过热与短期回调风险,建议采取核心持仓与战术配置结合的策略应对不确定性。 今年下半年特大牛市可能爆发吗 今年下半年加密货币市场存在爆发特大牛市的可能性,但需…

    2025年12月9日
    000
  • 加密货币牛市爆发的核心驱动力有哪些?

    加密货币牛市核心驱动力为技术创新、机构入场、宏观经济变化与全球需求增长。区块链技术进步推动DeFi和NFT发展,2025年Q1全球DeFi锁仓量超1600亿美元;机构资金大规模流入,2025年5月数字资产基金单周流入达330亿美元,Grayscale管理规模达280亿美元;全球经济不确定性加剧,通胀…

    2025年12月9日
    000
  • 如何合法获取免费加密货币?2025年免费合法获得加密货币的指南

    想要进入加密世界,并不一定需要投入大量资金。本指南将为您介绍2025年几种完全合法且免费获取加密货币的途径,尤其适合刚刚起步、希望零成本体验数字资产的朋友们。 一、加密货币主流交易平台地址推荐 1、币安binance: 2、欧意OKX: 3、HTX火币:     4、Gate.io: 二、关注项目空…

    2025年12月9日
    000
  • 为啥币圈不同币种的K线相关性那么强?走势图都差不多

    加密货币K线高度相关源于比特币主导、投资者心理趋同及宏观因素影响,BTC作为市场指数通过定价锚定、资金轮动和衍生品机制带动全市场波动,叠加美联储政策与稳定币收益率等系统性风险,导致多数币种同涨同跌;尽管技术升级、监管差异或极端行情可能引发短期分化,但长期仍以BTC为核心驱动,市场正逐步向多极化发展。…

    2025年12月9日
    000
  • token如何交易 token交易教程

    首先获取基础数字资产如USDT,选择可靠平台注册并完成KYC认证,充值时注意区块链网络一致,通过交易界面的K线图、订单簿和下单区进行限价或市价交易,交易后可在资产页面查看持仓,提现时需谨慎核对地址与网络。 Token交易通常在中心化的数字资产交易平台上进行。基本流程包括:选择一个可靠的交易平台并注册…

    2025年12月9日
    000
  • 代币是什么 一文搞懂!

    简单来说,代币(token)是建立在现有区块链网络之上的数字凭证。你可以把它想象成游乐园里的游戏币,这个本身不是货币,但它可以在游乐园这个特定的“网络”里用来玩游戏、买东西,代表着一种权利或价值。 2025年虚拟货币主流交易所: 币安:  欧易:  火币:  什么是代币? 代币与我们常说的比特币(B…

    2025年12月9日
    000
  • 如何看待币圈乱象以及有什么途径可以规避风险?

    币圈乱象源于信息不对称与监管滞后,表现为虚假项目、价格操纵和信息造假;规避风险需选择合规平台、深度研究项目、控制仓位、警惕高收益诱惑,并用技术工具验证信息,建立理性投资逻辑。 如何看待币圈乱象以及有什么途径可以规避风险? 币圈乱象的核心源于信息不对称、监管适配滞后与投机心态主导,常见表现为虚假项目、…

    2025年12月9日
    000
  • 进入币圈是自己摸索还是跟专业老师带呢?

    进入币圈建议采用“自学+导师指导”混合模式,先通过自学打基础,再选择可靠导师提升实战能力,最终实现独立决策,避免盲目跟风与高风险操作。 进入币圈是自己摸索还是跟专业老师带呢? 进入币圈的学习路径需根据个人基础、风险承受能力和时间成本综合选择:自学适合时间充裕、学习能力强的探索者,但需承担高试错风险;…

    2025年12月9日
    000
  • 新手币圈入门必备:哪些APP值得下载?加密货币交易所APP推荐

    币安、欧易、火币、Gate.io是主流加密货币交易所APP,选择时应重点考虑安全性、用户体验、交易费用、资产多样性和客户服务,并启用双重验证、防范钓鱼、设置强密码、进行小额测试以确保安全,辅助工具推荐CoinMarketCap、CoinGecko和TradingView用于行情分析与研究。 一、主流…

    2025年12月9日
    000
  • 怎么在币圈复制盈利?如何在加密货币圈赚大钱?

    币圈盈利复制需通过可量化的策略、历史回测与严格纪律实现,如趋势跟踪、套利和价值投资;赚大钱则依赖认知差、周期把握与复利,避免热点投机与高杠杆,核心是用规律和认知战胜市场随机性。 怎么在币圈复制盈利?如何在加密货币圈赚大钱? 币圈没有“一键复制”的盈利公式,但可通过“标准化策略+复盘优化”实现大概率盈…

    2025年12月9日
    000
  • Binance交易所app下载官网入口(Binanceapp手机客户端下载)

    本文旨在为广大用户提供一个清晰、安全的Binance官方网站入口及手机客户端下载指南。通过本文的指引,您可以准确找到官方渠道,有效规避仿冒网站和应用带来的风险,确保您的数字资产安全。 一、官方网站入口识别 1、通过搜索引擎查找:在google或bing等主流搜索引擎中输入请注意识别链接旁边的“官方网…

    2025年12月9日
    000
  • 币安交易所中文版下载地址 币安binance官方app

    您可以通过访问币安官方网站来获取其应用程序。网站通常会提供适用于不同操作系统(如安卓和苹果ios)的下载选项。请务必通过官方渠道进行下载,以确保您的账户安全。对于安卓用户,通常是直接下载应用程序文件进行安装;对于ios用户,可能需要遵循网站提供的特定指引进行安装。 币安官网直达: 币安官方app: …

    2025年12月9日
    000
  • 一文搞懂!代币和比特币的区别

    简单来说,比特币是其自有独立区块链上的原生加密货币,就像是“高速公路”本身;而代币则是在现有的区块链(如以太坊)上创建的数字资产,更像是行驶在这条“高速公路”上的“汽车”。 2025年虚拟货币主流交易所: 币安:  欧易:  火币:  关于交易平台 无论是比特币还是各种代币,它们的主要流通和买卖场所…

    2025年12月9日
    000
  • 在币圈中“主力机构”“狗庄”到底是什么?

    主力机构是合规、专业的大型投资实体,通过量化交易和长期持仓影响市场;狗庄则是利用杠杆、对倒交易和虚假信息操纵价格的投机者,二者在资金性质、操作周期和市场影响上存在本质区别。 在币圈中“主力机构”“狗庄”到底是什么? 币圈中的“主力机构”和“狗庄”是两类对市场价格具有显著影响力的参与者。前者通常指具备…

    2025年12月9日
    000
  • 稳定币有哪几种?稳定币以太坊还有上涨空间吗?

    本文旨在厘清当前主流%ignore_a_1%的核心分类,并深入探讨在以太坊网络上发行的稳定币是否仍具备广阔的增长前景。通过了解不同稳定币的运作机制,可以更好地把握其在数字资产世界中的作用与潜力。 一、稳定币主流交易所推荐 1、币安binance: 2、欧意OK: 3、HTX火币:     4、Gat…

    2025年12月9日
    000
  • 币圈交易所如何选择?从用户数量、可靠性、手机系统等各方面分析

    币安以40.7%现货份额领先,OKX、Coinbase等在细分领域优势明显,选择需优先考虑安全、流动性、体验与成本,结合用户规模、安全体系、流动性质量及移动端适配四大维度,根据投资需求匹配主平台与辅助平台。 币圈交易所如何选择?全方位决策指南 选择安全可靠的加密货币交易所是进入数字资产领域的关键一步…

    2025年12月9日
    000
  • Token有哪些分类?Token分类如何定义区分的

    Token有哪些分类?如何定义和区分 在加密货币世界中,Token(代币) 并不是一类固定的资产,它根据 功能、使用场景、价值承载方式 可以划分成多种类型。  理解 Token 分类有助于投资者 降低风险 和 识别价值。 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: …

    2025年12月9日
    000
  • token和session和cookie的区别是什么

    Token是无状态认证凭证,Session是服务器端状态管理机制,Cookie是客户端存储技术;三者中Token用于API认证,Session依赖服务器存储,Cookie可存储Session ID或Token以维持会话。 Token、Session和Cookie的区别 在了解加密货币交易所的运作时,…

    2025年12月9日
    000

发表回复

登录后才能评论
关注微信