腾讯机器狗进化:通过深度学习掌握自主决策能力

6月14日,腾讯robotics x机器人实验室公布了智能体研究的最新进展,通过将前沿的预训练ai模型和强化学习技术应用到机器人控制领域,让机器狗 max 的灵活性和自主决策能力得到大幅提升。

让机器狗像人和动物一样灵活且稳定的运动,是机器人研究领域长期追求的目标,深度学习技术的不断进步,使得让机器通过“学习”来掌握相关能力,学会应对复杂多变的环境变得可行。

引入预训练和强化学习:让机器狗更加灵动

腾讯Robotics X机器人实验室通过引入预训练模型和强化学习技术,可以让机器狗分阶段进行学习,有效的将不同阶段的技能、知识积累并存储下来,让机器人在解决新的复杂任务时,不必重新学习,而是可以复用已经学会的姿态、环境感知、策略规划多个层面的知识,进行“举一反三”,灵活应对复杂环境

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

这一系列的学习分为三个阶段:

第一阶段通过游戏技术中常使用动作捕捉系统,研究员收集真狗的运动姿态数据,包括走、跑、跳、站立等动作,并利用这些数据,在仿真器中构建了一个模仿学习任务,再将这些数据中的信息抽象并压缩到深度神经网络模型中。这些模型不仅能够准确地涵盖收集的动物运动姿态信息,而且具有相当高的可解释性。

腾讯Robotics X机器人实验室和腾讯游戏合作,用游戏技术提升了仿真引擎的准确和高效,同时游戏制作和研发过程中积累了多元的动捕素材。这些技术和数据在基于物理仿真的智能体训练和真实世界机器人策略部署中扮演了一定的辅助角色。

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

神经网络模型只接受机器狗的本体感知信息(如电机状态)作为输入,以模仿学习的方式进行训练。在下一步中,模型会融合周围环境的感知数据,例如利用其他传感器来探测脚底下的障碍物。

第二阶段,通过额外的网络参数来将第一阶段掌握的机器狗灵动姿态与外界感知联系在一起,使得机器狗能够通过已经学会的灵动姿态来应对外界环境。当机器狗适应了多种复杂的环境后,这些将灵动姿态与外界感知联系在一起的知识也会被固化下来,存在神经网络结构中。

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯混元 腾讯混元

腾讯混元大由腾讯研发的大语言模型,具备强大的中文创作能力、逻辑推理能力,以及可靠的任务执行能力。

腾讯混元 65 查看详情 腾讯混元

腾讯机器狗进化:通过深度学习掌握自主决策能力

腾讯机器狗进化:通过深度学习掌握自主决策能力

第三阶段,利用上述两个预训练阶段获取的神经网络,机器狗才有前提和机会来聚焦解决最上层的策略学习问题,最终具备端到端解决复杂的任务的能力。在第三阶段中,额外添加的网络将会收集与复杂任务有关的数据,例如在游戏中获取对手和旗帜的信息。此外,通过综合分析所有信息,负责策略学习的神经网络会学习出针对任务的高阶策略,例如往哪个方向跑动,预判对手的行为来决定是否继续追逐等等。

上述每一阶段学习到的知识都可以扩充和调整,不需要重新学习,因此可以不断积累,持续学习。

机器狗障碍追逐比赛 :拥有自主决策和控制能力

为了测试Max所掌握的这些新技能,研究员受到障碍追逐比赛“World Chase Tag“的启发,设计了一个双狗障碍追逐的游戏。World Chase Tag是一个竞技性障碍追逐赛组织,2014年创立于英国,由民间儿童追逐游戏标准化而来。一般来说,障碍追逐比赛每轮次由两名互为对手的运动员参加,一名是追击者(称为攻方),一名是躲避者(称为守方),当一名运动员在整个追逐回合中(即20秒)成功躲避对手(即未发生触碰)时,团队将获得一分。 在预定的追逐回合数中得分最多的战队赢得比赛。

机器狗障碍追逐比赛的场地尺寸为4.5米 x 4.5米,上面分布着一些障碍物。游戏起始,两个MAX机器狗会被放置在场地中的随机位置,且随机一个机器狗被赋予追击者的角色,另一个为躲避者,同时,场地中会在随机位置摆放一个旗子。

躲避者的目标是尽可能接近旗子,但要确保不被追击者捉住。追击者的任务则是抓住躲避者。如果躲避者在被抓到之前成功触碰到旗子,则两个机器狗的角色会瞬间发生互换,同时旗子会重新出现在另一个随机的位置。当躲避者被当前的追击者抓住并且此时扮演追击者角色的机器狗获胜时,游戏即告结束。在所有游戏中,两个机器狗的平均前进速度限制为0.5m/s。

从这个游戏看来,在基于预训练好的模型下,机器狗通过深度强化学习,已经具备一定的推理和决策能力:

比如,当追击者意识到自己在躲避者碰到旗子之前已经无法追上它的时候,追击者就会放弃追击,而是在远离躲避者的位置徘徊,目的是为了等待下一个重置的旗子出现。

另外,当追击者即将抓到躲避者的最后时刻,它喜欢跳起来向着躲避者做出一个”扑”的动作,非常类似动物捕捉猎物时候的行为,或者躲避者在快要接触旗子的时候也会表现出同样的行为。这些都是机器狗为了确保自己的胜利采取的主动加速措施。

据介绍,游戏中机器狗的所有控制策略都是神经网络策略,在仿真中进行学习并通过zero-shot transfer(零调整迁移),让神经网络模拟人类的推理方式,来识别从未见过的新事物,并把这些知识部署到真实机器狗上。例如下图所示,机器狗在预训练模型中学会的躲避障碍物的知识,被用在游戏中,即使带有障碍物的场景并未在Chase Tag Game的虚拟世界进行训练(虚拟世界中仅训练了平地下的游戏场景),机器狗也能顺利完成任务。

腾讯Robotics X机器人实验室长期致力于机器人前沿技术的研究,以此前在机器人本体、运动、控制领域等领先技术和积累为基础,研究员们也在尝试将前沿的预训练模型和深度强化学习技术引入到机器人领域,提升机器人的控制能力,让其更具灵活性,这也为机器人走入现实生活,服务人类打下了坚实的基础。

以上就是腾讯机器狗进化:通过深度学习掌握自主决策能力的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/519842.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 04:55:48
下一篇 2025年11月9日 04:59:35

相关推荐

  • 如何html转化URL_将HTML文件或内容转换为URL链接【链接】

    需将HTML转为可访问URL,必须部署到HTTP服务器:一、本地开发服务器(如python -m http.server);二、GitHub Pages永久托管;三、htmlpreview在线预览;四、云存储静态托管;五、data URL编码内联。 如果您拥有一个HTML文件或一段HTML内容,需要…

    2025年12月23日
    000
  • 如何抓取HTML内嵌视频_资源提取方法解析【技巧】

    提取网页内嵌视频实际地址需按五种方法操作:一查video/source标签;二用开发者工具抓media请求;三解析iframe目标页;四下载并处理m3u8流;五借助浏览器扩展自动识别。 如果您希望从网页中提取HTML内嵌视频的实际播放地址或原始资源文件,则可能是由于视频未提供直接下载链接,且被封装在…

    2025年12月23日
    000
  • HTML如何设置自定义域名_部署绑定步骤详解【指南】

    需通过DNS解析与Web服务器配置共同完成域名绑定:先确保域名实名认证并部署网站,再按平台要求配置CNAME或A记录,GitHub Pages需上传CNAME文件,自建服务器需配置Nginx虚拟主机,最后推荐启用HTTPS。 如果您已拥有一个域名并希望将其绑定到HTML静态网站,需通过DNS解析与W…

    2025年12月23日
    000
  • qq中如何使用html_在QQ中发送与展示HTML内容【展示】

    QQ不支持直接渲染HTML,可用五种方法展示:一、转为富文本图片;二、用“图文消息”卡片;三、嵌入QQ小程序WebView;四、以代码块发源码(限技术交流);五、通过QQ邮箱发ZIP附件。 如果您希望在QQ中发送或展示HTML内容,需注意QQ客户端本身不支持直接渲染HTML代码。以下是实现HTML内…

    2025年12月23日
    000
  • 怎么在微信上运行html代码_微信运行html代码方法【指南】

    答案是通过将HTML部署为公网链接或使用在线工具生成可访问网址,再在微信中打开链接来间接实现HTML页面展示。具体可通过GitHub Pages等平台托管网页、利用小程序web-view组件加载、或用JSBin等在线编辑器生成预览链接发送至微信查看,注意兼容性与安全限制。 微信本身不支持直接运行HT…

    2025年12月23日
    000
  • html如何做个地图_使用HTML与JS集成在线地图【在线】

    网页嵌入可交互在线地图需借助第三方API:一、高德地图需申请Key并引入SDK;二、百度地图需获取AK并初始化BMap;三、Leaflet配合OSM免密钥但需遵守版权;四、腾讯地图支持iframe快速嵌入但交互受限;五、Google Maps Embed API需有效密钥且限国际使用。 如果您希望在…

    2025年12月23日
    000
  • 在网站怎么运行html_网站运行html方法【教程】

    答案是将HTML文件部署到服务器或使用托管平台使其可通过浏览器访问。首先可在本地用Live Server或Python命令测试,仅限本机查看;正式发布需将文件上传至云服务器并配置Apache等服务,或更便捷地使用GitHub Pages、Vercel、Netlify等静态托管平台,部署后通过域名访问…

    2025年12月23日
    000
  • html网页怎么在微信运行_微信运行html网页方法【指南】

    首先确保HTML网页通过HTTPS访问,部署在支持SSL的服务器上;其次可通过微信公众平台配置安全域名并发布链接以提升兼容性;接着使用微信开发者工具进行调试,检查脚本错误与资源加载问题;然后优化代码适配微信浏览器,避免使用非标准CSS、弹窗操作及相对路径资源;最后可直接通过微信聊天发送链接测试页面加…

    2025年12月23日
    000
  • HTML5移动开发怎么用_HTML5新特性在移动Web开发中的应用技巧

    HTML5凭借语义化标签、本地存储、多媒体支持和设备API等特性,广泛应用于移动Web开发。使用、、等标签提升结构清晰度与可访问性,结合Flex或Grid实现响应式布局;通过localStorage和sessionStorage缓存数据,优化离线体验;利用、原生支持音视频播放,节省流量并提升交互;结…

    2025年12月23日
    000
  • html如何使用视频_HTML视频(video/iframe)嵌入与控制方法

    使用video标签可嵌入本地视频并支持多格式兼容,通过controls、autoplay等属性控制播放;iframe则用于嵌入YouTube等第三方平台视频,需设置src为视频ID并配置allow权限,两者均可通过poster、JavaScript或URL参数实现封面、播放控制与功能优化。 在网页中…

    好文分享 2025年12月23日
    000
  • html缓存内容怎么一键删除_html缓存内容一键删除的完整攻略

    网页加载异常或显示旧内容时,可通过清除浏览器缓存解决。首先在Chrome、Edge等浏览器中按Ctrl+Shift+Delete选择“所有时间”并勾选“缓存的图像和文件”后清除;其次使用开发者工具右键“检查”或F12,长按刷新按钮选择“清空缓存并硬性重新加载”,或直接按Ctrl+F5强制刷新;还可修…

    2025年12月23日
    000
  • html如何改域名_HTML网站域名(DNS解析)修改绑定方法

    更换网站域名需配置DNS解析和服务器设置,首先在域名平台添加A记录指向服务器IP,并在服务器中绑定新域名,最后更新网站内部链接为新域名或相对路径。 修改HTML网站绑定的域名本质上不是在HTML文件中操作,而是通过DNS解析和服务器配置来实现。HTML本身是静态网页语言,不涉及域名绑定逻辑。要更换网…

    2025年12月23日
    000
  • html官方资源入口_html网站免费设计导航

    html网站免费设计导航入口是https://www.htmldesignresources.com,该平台提供HTML模板、响应式示例、表单组件和CSS样式资源,支持预览、搜索、筛选与代码复制,并设有社区投稿、论坛交流及季度报告更新功能。 html网站免费设计导航入口在哪里?这是不少网页设计爱好者…

    2025年12月23日
    000
  • html源码怎么保存为云端网页源码_html源码保存到云端的技巧

    1、可通过GitHub Pages、Vercel、Netlify或云存储服务将HTML源码部署为云端网页。2、GitHub Pages免费且支持自定义域名,适合静态页面;Vercel与Netlify提供一键部署,操作便捷;云存储如OSS需设公共读权限并获取外链。 如果您希望将本地编写的HTML源码保…

    2025年12月23日
    000
  • 怎么部署HTML在线展示页面_HTML在线展示页面部署流程与托管平台选择

    部署HTML页面需准备文件、选托管平台、上传并发布。首先确保index.%ignore_a_1%及资源路径正确,本地测试无误;接着选择GitHub Pages、Vercel、Netlify或云存储等平台;以GitHub Pages为例,推送代码至仓库后在Settings中启用Pages功能,系统自动…

    2025年12月23日
    000
  • html5怎么做网站_HTML5网站建设流程与设计要点

    明确目标后规划网站结构,使用语义化HTML5标签搭建内容框架,通过响应式设计适配多设备,优化图片与代码提升加载速度,并经多环境测试后部署至静态托管平台完成上线。 做HTML5网站不只是写代码,而是从规划到上线的完整过程。重点在于响应式设计、语义化结构和良好的用户体验。以下是实际操作中的关键步骤和设计…

    2025年12月23日
    000
  • html5文件如何实现云存储对接 html5文件直传云服务的配置指南

    答案:通过配置阿里云OSS、腾讯云COS、华为云OBS和七牛云Kodo的前端直传方案,可实现文件不经过服务器中转直接上传至云存储。1、阿里云OSS使用PostObject接口,后端生成policy和签名,前端构造POST请求上传;2、腾讯云COS通过STS获取临时密钥,前端使用cos-js-sdk-…

    2025年12月23日
    000
  • HTML数据怎样进行情感分析 HTML数据情感挖掘的实现路径

    答案是:从HTML中提取有效文本并进行情感分析需先清理标签获取正文,再经文本预处理、分词与去噪后,应用词典、机器学习或深度学习模型判断情感倾向,最终整合结果并可视化,实现舆情监控与评价分析。 对HTML数据进行情感分析,核心在于从网页内容中提取有效文本,并在此基础上应用自然语言处理技术判断情感倾向。…

    2025年12月23日
    000
  • 如何通过HTML在线展示地图_HTML在线地图展示实现与API集成方案

    选择合适的地图API如高德地图,通过申请密钥、引入JS API并初始化地图实例,可在HTML中快速实现交互式地图展示,结合标记与信息窗口增强功能,注意密钥安全与性能优化。 要在网页中实现地图展示,最常用的方式是集成第三方地图API,比如Google Maps、高德地图或腾讯地图。这些服务提供Java…

    2025年12月23日
    000
  • HTML5 section怎么用_HTML5内容分区标签应用场景说明

    在HTML5中,标签用于定义文档中具有明确主题的独立内容区块,需包含标题以体现其结构性与语义性,常用于文章章节、产品模块等场景,区别于无语义的和可独立分发的。 在HTML5中,section 标签用于定义文档中的一个独立内容区块。它不是简单的容器,而是有语义的结构化标签,表示文档中一个主题性的分区,…

    2025年12月23日
    000

发表回复

登录后才能评论
关注微信