腾讯机器狗进化:通过深度学习掌握自主决策能力

6月14日,腾讯robotics x机器人实验室公布了智能体研究的最新进展,通过将前沿的预训练ai模型和强化学习技术应用到机器人控制领域,让机器狗 max 的灵活性和自主决策能力得到大幅提升。

让机器狗像人和动物一样灵活且稳定的运动,是机器人研究领域长期追求的目标,深度学习技术的不断进步,使得让机器通过“学习”来掌握相关能力,学会应对复杂多变的环境变得可行。

引入预训练和强化学习:让机器狗更加灵动

腾讯Robotics X机器人实验室通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效的将不同阶段的技能、知识积累并存储下来,让机器人在解决新的复杂任务时,不必重新学习,而是可以复用已经学会的姿态、环境感知、策略规划多个层面的知识,进行“举一反三”,灵活应对复杂环境

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

这一系列的学习分为三个阶段:

第一阶段通过游戏技术中常使用动作捕捉系统,研究员收集真狗的运动姿态数据,包括走、跑、跳、站立等动作,并利用这些数据,在仿真器中构建了一个模仿学习任务,再将这些数据中的信息抽象并压缩到深度神经网络模型中。这些模型不仅能够准确地涵盖收集的动物运动姿态信息,而且具有相当高的可解释性。

腾讯Robotics X机器人实验室和腾讯游戏合作,用游戏技术提升了仿真引擎的准确和高效,同时游戏制作和研发过程中积累了多元的动捕素材。这些技术和数据在基于物理仿真的智能体训练和真实世界机器人策略部署中扮演了一定的辅助角色。

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

神经网络模型只接受机器狗的本体感知信息(如电机状态)作为输入,以模仿学习的方式进行训练。在下一步中,模型会融合周围环境的感知数据,例如利用其他传感器来探测脚底下的障碍物。

第二阶段,通过额外的网络参数来将第一阶段掌握的机器狗灵动姿态与外界感知联系在一起,使得机器狗能够通过已经学会的灵动姿态来应对外界环境。当机器狗适应了多种复杂的环境后,这些将灵动姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯混元 腾讯混元

腾讯混元大由腾讯研发的大语言模型,具备强大的中文创作能力、逻辑推理能力,以及可靠的任务执行能力。

腾讯混元 65 查看详情 腾讯混元

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

第三阶段,利用上述两个预训练阶段获取的神经网络,机器狗才有前提和机会来聚焦解决最上层的策略学习问题,最终具备端到端解决复杂的任务的能力。在第三阶段中,额外添加的网络将会收集与复杂任务有关的数据,例如在游戏中获取对手和旗帜的信息。此外,通过综合分析所有信息,负责策略学习的神经网络会学习出针对任务的高阶策略,例如往哪个方向跑动,预判对手的行为来决定是否继续追逐等等。

上述每一阶段学习到的知识都可以扩充和调整,不需要重新学习,因此可以不断积累,持续学习。

机器狗障碍追逐比赛 :拥有自主决策和控制能力

为了测试Max所掌握的这些新技能,研究员受到障碍追逐比赛“World Chase Tag“的启发,设计了一个双狗障碍追逐的游戏。World Chase Tag是一个竞技性障碍追逐赛组织,2014年创立于英国,由民间儿童追逐游戏标准化而来。一般来说,障碍追逐比赛每轮次由两名互为对手的运动员参加,一名是追击者(称为攻方),一名是躲避者(称为守方),当一名运动员在整个追逐回合中(即20秒)成功躲避对手(即未发生触碰)时,团队将获得一分。 在预定的追逐回合数中得分最多的战队赢得比赛。

机器狗障碍追逐比赛的场地尺寸为4.5米 x 4.5米,上面分布着一些障碍物。游戏起始,两个MAX机器狗会被放置在场地中的随机位置,且随机一个机器狗被赋予追击者的角色,另一个为躲避者,同时,场地中会在随机位置摆放一个旗子。

躲避者的目标是尽可能接近旗子,但要确保不被追击者捉住。追击者的任务则是抓住躲避者。如果躲避者在被抓到之前成功触碰到旗子,则两个机器狗的角色会瞬间发生互换,同时旗子会重新出现在另一个随机的位置。当躲避者被当前的追击者抓住并且此时扮演追击者角色的机器狗获胜时,游戏即告结束。在所有游戏中,两个机器狗的平均前进速度限制为0.5m/s。

从这个游戏看来,在基于预训练好的模型下,机器狗通过深度强化学习,已经具备一定的推理和决策能力:

比如,当追击者意识到自己在躲避者碰到旗子之前已经无法追上它的时候,追击者就会放弃追击,而是在远离躲避者的位置徘徊,目的是为了等待下一个重置的旗子出现。

另外,当追击者即将抓到躲避者的最后时刻,它喜欢跳起来向着躲避者做出一个”扑”的动作,非常类似动物捕捉猎物时候的行为,或者躲避者在快要接触旗子的时候也会表现出同样的行为。这些都是机器狗为了确保自己的胜利采取的主动加速措施。

据介绍,游戏中机器狗的所有控制策略都是神经网络策略,在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器狗上。例如下图所示,机器狗在预训练模型中学会的躲避障碍物的知识,被用在游戏中,即使带有障碍物的场景并未在Chase Tag Game的虚拟世界进行训练(虚拟世界中仅训练了平地下的游戏场景),机器狗也能顺利完成任务。

腾讯Robotics X机器人实验室长期致力于机器人前沿技术的研究,以此前在机器人本体、运动、控制领域等领先技术和积累为基础,研究员们也在尝试将前沿的预训练模型和深度强化学习技术引入到机器人领域,提升机器人的控制能力,让其更具灵活性,这也为机器人走入现实生活,服务人类打下了坚实的基础。

以上就是腾讯机器狗进化:通过深度学习掌握自主决策能力的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/519842.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 04:55:48
下一篇 2025年11月9日 04:59:35

相关推荐

  • AI与区块链融合:未来科技发展趋势

    在数字经济浪潮中,人工智能(ai)与区块链技术的深度融合,正成为一股不可逆转的洪流,塑造着未来科技发展的全新格局。这种融合不仅是技术层面的简单叠加,更是理念与实践的交织,有望解决当前数字世界面临的诸多挑战,例如数据信任、隐私保护、效率提升等。想象一下,一个由智能合约驱动的供应链,每个环节的数据都由a…

    好文分享 2025年12月11日
    000
  • 用五千元如何在币圈牛市赚到百万

    在加密货币的牛市周期中,市场情绪高涨,资金大量涌入,为小额资本创造了实现指数级增长的理论可能性。将五千元的初始本金增值至百万,意味着需要实现近两百倍的回报。这并非一个简单的押注游戏,而是一场涉及策略、信息、情绪控制和时机把握的综合性博弈。 2025主流数字货币交易所: 1、欧易OKX: 注册入口: …

    2025年12月11日
    000
  • 探索加密货币市场的高频交易策略

    探索加密货币市场的高频交易策略,无疑是当下金融科技领域最令人振奋的话题之一。在这个24/7不间断运作的数字资产世界里,速度与效率成为了决定成败的关键。高频交易(hft)并非仅仅是快速买卖那么简单,它是一门集成了先进算法、复杂数学模型和尖端技术的艺术,旨在利用市场中稍纵即逝的微小机会。从市场微结构的不…

    好文分享 2025年12月11日
    000
  • 加密货币是什么?和虚拟货币有什么不一样?能赚钱吗

    加密货币基于区块链技术,具有去中心化、总量固定、交易透明等特点,与中心化发行的虚拟货币在技术、主体、使用范围和价值机制上存在本质区别,且投资加密货币存在高风险。 Binance币安 官网直达: 安卓安装包下载: 欧易OKX ️ 官网直达: 安卓安装包下载: Huobi火币️ 官网直达: 安卓安装包下…

    2025年12月11日
    000
  • PHP怎么配置虚拟主机_PHP虚拟主机设置教程

    配置PHP虚拟主机需选择支持PHP的服务商并购买主机,解析域名至主机IP,上传网站文件到指定目录,通过控制面板设置PHP版本、数据库连接及伪静态规则,最后测试访问。 配置PHP虚拟主机,简单来说,就是让你的网站能够跑起来,并且能用域名访问。这涉及到服务器配置、域名解析以及文件上传等几个关键步骤。 解…

    2025年12月11日
    100
  • php如何使用Composer管理依赖?Composer依赖管理工具入门指南

    Composer是PHP项目依赖管理的核心工具,通过composer.json定义依赖,利用composer install和composer update管理库版本,并借助composer.lock确保环境一致性;配置autoload实现PSR-4标准的自动加载,提升代码组织与维护性;建议使用国内…

    2025年12月11日
    000
  • php如何给图片添加水印?PHP图片水印添加技术实现

    PHP添加图片水印的核心是使用GD库或ImageMagick加载源图和水印,计算位置后叠加并保存;常见问题包括内存溢出、透明度丢失,可通过限制图片尺寸、正确处理alpha通道解决;文字水印推荐使用imagettftext支持自定义字体,结合imagecolorallocatealpha实现透明效果;…

    2025年12月10日
    000
  • 什么是PHP在线执行的负载均衡?优化多用户访问的负载管理策略

    答案:PHP负载均衡通过分发请求至多台服务器提升网站稳定性,核心在于构建可伸缩架构,包含负载均衡器、多台PHP服务器、共享存储与优化数据库;关键挑战是会话一致性,需用Redis等集中式存储解决,同时结合缓存、异步处理与CDN等策略优化整体性能。 PHP在线执行的负载均衡,简单来说,就是把大量用户对你…

    2025年12月10日
    000
  • PHP如何备份数据库 PHP数据库备份的完整步骤

    php备份数据库的步骤为:1.连接数据库;2.获取所有表名;3.循环备份每个表;4.保存到文件;5.关闭数据库连接。优化方法包括分块读取数据、使用mysqldump命令、压缩备份文件、异步执行。错误处理应使用try-catch块、记录日志、设置超时时间、发送通知。定期自动备份可通过cron任务、wi…

    2025年12月10日 好文分享
    000
  • MAN币是什么?发行量多少?投资价值分析

    MAN币是Matrix AI Network的原生代币,总发行量10亿枚,用于支付费用。项目融合AI与区块链技术,通过自然语言生成智能合约、AI安全防护和动态DPoS机制提升效率与安全,应用于生物信息、数字艺术等领域,团队具备AI与区块链背景,代币已上线多家交易所,流动性良好。 欧易okx官网入口:…

    2025年12月9日
    000
  • 以太坊期权AI预测工具有哪些?以太坊期权AI预测工具APP大全

    CryptoEye、币安、OKX均提供AI驱动的以太坊期权分析工具。CryptoEye通过AI生成预测信号并设聊天助手,用户需下载App、注册账户、订阅服务后查看图表信号;币安集成AI分析工具,展示ETH期权持仓、波动率等数据,用户注册后可启用“AI市场洞察”获取趋势判断与警报;OKX智能策略中心利…

    2025年12月9日
    000
  • 一文了解什么是AKEDO?探索赋能游戏创作和Web3所有权的多智能体AI平台

    Binance币安 欧易OKX ️ Huobi火币️ 摘要  AKEDO 是一个多智能体AI平台,让任何人都能使用自然语言提示创建完整游戏——无需编程。它结合了 AI驱动的创作工具 与 Web3所有权和变现 ,通过其原生代币 $AKE 奖励创作者、玩家和节点运营商。 四个主要AI智能体 — 世界构建…

    2025年12月9日
    000
  • 什么是大型语言模型(LLM)?如何利用LLM进行加密货币研究与交易决策

    大型语言模型(LLM)是指通过深度学习训练的大规模人工智能模型,能够理解、生成和分析自然语言内容。在加密货币领域,LLM 可以帮助投资者快速分析新闻资讯、社交媒体舆情以及市场数据,从而辅助研究和交易决策。 大型语言模型的核心特点 LLM 拥有以下优势: 海量信息处理能力:能够快速分析和归纳新闻、研究…

    2025年12月9日
    000
  • 比特币入门基础知识讲解_用生活例子说清楚比特币原理

    比特币入门基础知识讲解_用生活例子说清楚比特币原理 大家好!一提到比特币,很多人可能觉得它非常高深,充满了复杂的代码和数学公式。其实,比特币的核心原理完全可以用我们生活中的例子来解释清楚。今天,我们就抛开所有技术术语,用一个村庄的故事,让你彻底明白比特币到底是怎么一回事。 首先,比特币是什么? 简单…

    好文分享 2025年12月9日
    000
  • 什么是 AI 加密货币交易机器人?从进程化到智能化

    前言:为何需要交易机器人? 加密货币市场以其惊人的波动性和全天候不间断交易的特性而闻名。对于人类交易者而言,要做到7×24小时不间断地监控市场、分析数据并做出毫秒级决策,几乎是不可能的。这为自动化交易工具的出现创造了巨大的需求。ai加密货币交易机器人,正是这一需求的终极解决方案,它代表了从…

    2025年12月9日
    000
  • 易欧交易所app官网正版下载入口

    欧易(okx)是合规运营的数字资产交易平台,用户应通过官方渠道下载其app以确保安全。直接访问非官方链接存在个人信息泄露或资金损失的风险。 如何安全获取欧易App OKX官方合作伙伴认证 · 一站式安全交易体验 官网直达: 安卓安装包下载: 为避免下载到仿冒应用,务必通过以下方式获取: 官方网站:在…

    2025年12月9日
    000
  • 微信红包提示异常怎么办 微信红包领取与发送优化方法

    答案是多数微信红包异常可自助解除。进入钱包帮助中心选择解除支付限制,按提示完成人脸识别或补充信息;若失败则通过腾讯客服小程序提交申诉,注明情况并上传证明材料;解除后确保实名认证、避免频繁收发红包,多进行正规消费以提升账户可信度,防止再次受限。 微信红包提示异常,多数情况是系统风控触发的临时限制。别急…

    2025年12月6日 软件教程
    000
  • 如何彻底解决苹果手机QQ闪退_彻底解决苹果手机QQ闪退的步骤

    首先更新QQ和iOS系统至最新版本,其次清理QQ缓存或重装应用,接着关闭后台程序并确保足够存储空间,最后尝试还原所有设置或通过电脑恢复系统,多数闪退问题可解决。 苹果手机QQ闪退通常由应用兼容性、系统资源不足或缓存异常导致。解决这类问题需要从基础排查到深度修复逐步进行,多数情况下无需专业工具也能搞定…

    2025年12月6日 手机教程
    000
  • 腾讯元宝网页版通道 腾讯元宝官网直接入口

    腾讯元宝官网网页版支持微信、QQ、手机号登录,无需下载即可使用智能对话、文件解析、内容创作和AI阅读等功能,还可通过App、小程序等多端使用。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 腾讯元宝的官方网页版可以直接通过官网地址访问。打开…

    2025年12月6日 科技
    000
  • 腾讯朱雀AI在线检测 朱雀大模型官网网页版链接工具

    腾讯朱雀AI在线检测入口地址是https://matrix.tencent.com/ai-detect,用户可直接访问官网使用文本或图片检测功能,无需注册登录;平台支持粘贴文本或上传文档进行AI生成内容检测,5秒内生成报告,标注AI生成概率、具体段落及语言风格特征,帮助用户高效辨别内容来源。 ☞☞☞…

    2025年12月6日 科技
    000

发表回复

登录后才能评论
关注微信