陪跑又快又稳,机器人跑步搭子来了

这个机器人名叫cassie,曾经创下百米跑世界纪录。最近,加州大学伯克利分校的研究者给它开发了一种新的深度强化学习算法,让它掌握了急转弯等技能,还能对抗各种干扰。

Giiso写作机器人 Giiso写作机器人

Giiso写作机器人,让写作更简单

Giiso写作机器人 56 查看详情 Giiso写作机器人

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

陪跑又快又稳,机器人跑步搭子来了                                                                              【关注本站视频号,第一时间看到有趣的 AI 内容】

关于双足机器人运动的研究已经进行了几十年,但仍然没有一个能够对各种运动技能进行稳健控制的通用框架。挑战来自于双足机器人欠驱动动态的复杂性以及与每种运动技能相关的不同规划。
研究者们希望解决的关键问题在于:如何为高维人体大小的双足机器人开发一种解决方案?如何控制多样化、敏捷和稳健的腿部运动技能,比如行走、跑步和跳跃?
最近的一项研究或许提供了不错的方案。
在这项工作中,来自伯克利等机构的研究者利用强化学习(RL)为现实世界中的高维非线性双足机器人创建控制器,以应对上述挑战。这些控制器可以利用机器人的本体感觉信息来适应随时间变化的不确定动态,同时能够适应新的环境和设置,利用双足机器人的敏捷性,在突发情况下表现出稳健的行为。此外,本文框架还提供了再现各种双足运动技能的通用配方。
陪跑又快又稳,机器人跑步搭子来了
论文标题:Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control
论文链接:https://arxiv.org/pdf/2401.16889.pdf
论文细节
对于控制器来说,扭矩控制人体大小的双足机器人的高维性和非线性乍似乎是障碍,然而这些特性的优势在于可以通过机器人的高维动力学实现复杂的敏捷操作。
这一控制器赋予机器人的技能如图 1 所示,包括稳健的站立、行走、奔跑和跳跃。这些技能还可用于执行各种不同的任务,包括以不同速度和高度行走、以不同速度和方向奔跑以及跳向各种目标,同时在实际部署过程中保持稳健性。为此,研究者利用无模型 RL 让机器人通过对系统全阶动态的试错来学习。除了真实世界的实验,还深入分析了使用 RL 进行腿部运动控制的好处,并详细研究了如何有效地构建学习过程以利用这些优势,如适应性和稳健性。
陪跑又快又稳,机器人跑步搭子来了
用于通用双足运动控制的 RL 系统如图 2 所示:
陪跑又快又稳,机器人跑步搭子来了
第四节首先介绍了在运动控制中利用机器人 I/O 历史记录的重要性,这一节从控制和 RL 两个角度展示了机器人的长期 I/O 历史可以在实时控制过程中实现系统识别和状态估计。
第五节介绍了研究的核心:一种利用双足机器人长期和短期 I/O 双历史记录的新型控制架构。具体来说,这种控制架构不仅能利用机器人的长期历史记录,还能利用机器人的短期历史记录。
控制框架如下图:
陪跑又快又稳,机器人跑步搭子来了
在这种双历史记录结构中,长期历史记录带来了适应性(在第八节中得到验证),短期历史记录则通过实现更好的实时控制对长期历史记录的利用进行了补充(在第七节中得到验证)。
第六节介绍了如何将由深度神经网络表示的控制策略通过无模型 RL 进行优化。鉴于研究者旨在开发一种能够利用高动态运动技能完成各种任务的控制器,因此这一节中的训练以多阶段模拟训练为特征。这种训练策略提供了一个结构化的课程,首先是单一任务训练,即机器人专注于一个固定的任务,然后是任务随机化,使机器人接受的训练任务多样化,最后是动态随机化,改变机器人的动态参数。
策略如下图所示:
陪跑又快又稳,机器人跑步搭子来了
这种训练策略能够提供一种多功能控制策略,可以执行多种任务,并实现机器人硬件的零样本迁移。此外,任务随机化还能通过在不同的学习任务中进行泛化来增强所产生策略的稳健性。
研究表明,这种稳健性可以使机器人对干扰做出顺从的行为,这与动态随机化带来的干扰是「正交」的。这一点将在第九节中得到验证。
利用这一框架,研究者获得了针对双足机器人 Cassie 的行走、跑步和跳跃技能的多功能策略。第十章评估了这些控制策略在现实世界中的有效性。
实验
研究者对机器人进行了广泛的实验,包括在现实世界中行走、跑步和跳跃等多项能力的测试。所用策略在经过模拟训练后都能够有效地控制现实世界中的机器人,而无需进一步调整。
行走实验
如图 14a 所示,行走策略展示了对机器人遵循不同指令的有效控制,在整个测试过程中,跟踪误差相当低(跟踪误差由 MAE 的值来评估)。 
此外,机器人策略在较长时间内始终表现良好,即使在 325 天和 492 天后仍具有保持跟踪可变命令的能力,分别如图 14c 和图 14b 所示。尽管在此期间机器人的动力学发生了显著的累积变化,但图 14a 中的同一控制器继续有效地管理不同的行走任务,并且跟踪误差的退化最小。
陪跑又快又稳,机器人跑步搭子来了
如图 15 所示,该研究所用的策略显示出对机器人可靠的控制,使机器人能够准确地跟踪顺时针或逆时针的不同转弯命令。
陪跑又快又稳,机器人跑步搭子来了
快速行走实验。除了中等行走速度之外,实验还展示了所用策略控制机器人向前和向后执行快速行走动作的能力,如图 16 所示。机器人可以从静止状态过渡到快速实现向前行走速度,平均速度达到 1.14 m/s(跟踪指令中要求 1.4 m/s),机器人还能按照指令快速返回站立姿态,如图 16a 所示,数据记录在图 16c 中。
陪跑又快又稳,机器人跑步搭子来了
在不平坦的地形上(未经训练),机器人也可以在楼梯或下坡上有效地向后行走,如下图所示。
陪跑又快又稳,机器人跑步搭子来了
抗扰动。在脉冲扰动的情况下,比如研究者在机器人步行时从各个方向向机器人引入了短时间内的外部扰动。就像图 18a 中记录的那样,在原地行走时向机器人施加相当大的横向扰动力,横向速度峰值为 0.5 m/s。尽管有扰动,机器人仍能迅速从横向偏差中恢复过来。如图 18a 所示,机器人熟练地沿相反的横向方向移动,有效地补偿扰动并恢复其稳定的原地行走步态。
陪跑又快又稳,机器人跑步搭子来了
在持续扰动测试期间,人类对机器人底座施加扰动力量,并沿随机方向拖动机器人,同时命令机器人原地行走。如图 19a 所展示的,当机器人正常行走时,持续的横向拖力施加到 Cassie 的底座上。结果显示机器人在不失去平衡的情况下,通过遵循这些外力的方向来表现出对这些外力的顺应性。这也表明了本文提出的基于强化学习的策略在控制双足机器人以实现安全人机交互等潜在应用方面的优势。
跑步实验
当机器人使用双足跑步策略,在 2 分 34 秒内实现了 400 米冲刺,在 27.06 秒内实现了 100 米冲刺,跑步倾斜度高达 10° 等等。
400 米短跑:该研究首先评估了在标准室外跑道上完成 400 米短跑的一般跑步策略,如图 20 所示。在整个测试过程中,机器人被命令以 3.5 m/s 的速速同时响应由操作员发出的不同转弯命令。机器人能够从站立姿态平滑地过渡到跑步步态(图 20a 1)。机器人设法加速到平均估计运行速度 2.15 m/s,达到峰值估计速度 3.54 m/s,如图 20b 所示。该策略使机器人成功地在整个 400 米跑步过程中始终保持所需的速度,同时准确地遵守不同的转弯命令。
陪跑又快又稳,机器人跑步搭子来了
在所提出的跑步策略的控制下,Cassie 在 2 分 34 秒内成功完成了 400 米冲刺,随后能够过渡到站立姿态。 
该研究进一步进行了急转弯测试,其中机器人被给予偏航命令的阶跃变化,从 0 度直接到 90 度,如图 21c 中记录的。机器人可以响应这样的步进命令,并在 2 秒 5 步内完成 90 度急转弯。
陪跑又快又稳,机器人跑步搭子来了
100 米短跑:如图 22 所示,通过部署所提出的跑步策略,机器人在大约 28 秒内完成了 100 米短跑,实现了 27.06 秒的最快跑步时间。
陪跑又快又稳,机器人跑步搭子来了
跳跃实验
通过实验证明,研究者发现很难训练机器人在跳跃到高架平台的同时同时转弯,但所提出的跳跃策略实现了机器人多种不同的双足跳跃,包括可以跳跃 1.4 米以及跳到 0.44 米高架平台上。
跳跃和转弯:如图 25a 所示,使用单次跳跃策略,机器人能够执行各种给定的目标跳跃,例如旋转 60° 时原地跳跃、向后跳跃到后面 0.3 米处着陆等。 
陪跑又快又稳,机器人跑步搭子来了
跳跃到高架平台:如图 25b 所示,机器人能够精确跳跃到不同位置的目标上,例如前方 1 米或前方 1.4 米,它还能跳到不同高度的位置,包括跳到 0.44 米高的地方(考虑到机器人本身只有 1.1 米高)。
了解更多内容,请参考原论文。

以上就是陪跑又快又稳,机器人跑步搭子来了的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/426659.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 11:59:26
下一篇 2025年11月7日 12:05:16

相关推荐

  • 如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

    使用HTML构建标签结构,CSS3添加旋转与过渡效果,JavaScript生成随机HSL颜色并设置字体大小,实现动态交互的标签云组件。 要在网页中实现一个动态的标签云组件,结合 HTML、CSS3 变换和随机颜色生成算法,可以按照以下步骤操作。这个组件不仅能提升页面视觉效果,还能通过色彩和旋转增加交…

    2025年12月23日
    000
  • 如何在Go Gin应用中集成前端JavaScript模块(如Sentry)

    本文探讨了在Go Gin框架下,通过HTML模板服务前端页面时,如何有效集成JavaScript模块(如Sentry)。针对浏览器不直接支持Node.js模块导入语法的问题,文章详细阐述了利用CDN引入Sentry SDK的解决方案,并提供了具体的代码示例,帮助开发者实现前端错误监控功能,避免了复杂…

    2025年12月23日
    000
  • html官网浏览入口_html网站设计免费平台

    html官网浏览入口在https://www.codepen.io,该平台支持实时预览代码、创建Pen项目、Fork开源示例,可添加外部资源,具备点赞评论收藏等社区互动功能,设有挑战活动与作品集分类,开放API接口,界面简洁适合初学者,在线编写无需配置环境,支持多种预处理器和响应式测试。 html官…

    2025年12月23日
    000
  • html如何修改日期样式

    在html中,可以使用“::-webkit-datetime-edit”伪元素选择器来修改日期格式,只需要用该选择器选中元素,在设置具体样式即可,具体语法为“::-webkit-datetime-edit{属性:属性值}”。 本教程操作环境:windows7系统、CSS3&&HTML…

    2025年12月21日
    100
  • 单选框的type属性值为什么

    单选框的type属性值为“radio”。html type属性可以规定要显示的输入框“”元素的类型;值为“radio”时显示为单选框、“checkbox”时显示为复选框、“select”时显示为下拉式选框等等。 本教程操作环境:windows7系统、HTML5版、Dell G3电脑。 在HTML中,…

    2025年12月21日
    000
  • HTML中type是什么意思

    在HTML中,type是类型的意思,是一个标签属性,主要用于定义标签元素的类型或文档(脚本)的MIME类型;例在input标签中type属性可以规定input元素的类型,在script标签中type属性可以规定脚本的MIME类型。 本教程操作环境:windows7系统、html5版、Dell G3电…

    2025年12月21日
    000
  • HTML中ul标签如何去掉点?HTML无序列表的样式实例解析

    本篇文章主要讲述的是关于html中的ul标签的默认小点给取消掉,还有关于html的无序列表ul标签的样式解释,给出了ul标签中的type属性三种值的介绍。现在就让我们一起来看本篇文章吧 首先这篇文章一开始我们就开始介绍在html中是怎么把ul标签的点给去掉的: 大家应该都使用过ul无序列表标签,ul…

    2025年12月21日 好文分享
    000
  • html中的ol标签如何去掉标号呢?标签的使用方法总结

    本篇文章介绍了html的ol标签是怎么去掉序号标号的,这里还有代码的详细解释,还有介绍了关于html ol有序列表标签如何更改序号,下文介绍了三种序号,大家也可以自己去想填写怎样的序号。现在来看这篇文章吧 一、我们先看看html中的ol标签是如何去掉标号的呢: 我们都知道html的ol标签是个有序列…

    2025年12月21日 好文分享
    000
  • HTML ul标签的什么意思?HTML ul标签的作用详解

    本篇文章主要的为大家讲解了关于html ul标签的三种重要的用法,还有关于html ul标签的解释,包含li标签的还有type属性对ul标签的使用情况,好了,下面大家一起来看文章吧 首先让我们先来解释一下HTML ul标签的意思: ul标签定义的是表格当中无序列表,表格当中的无序列表都是在 标签之中…

    2025年12月21日
    000
  • javascript框架和库是什么_如何选择React、Vue或Angular?

    JavaScript框架与库分别提供按需调用的功能集合和约束性开发结构;React是UI组件库,生态灵活但需自行整合工具;Vue渐进式易上手,兼顾原型与工程化;Angular是全功能TypeScript框架,适合强规范企业级项目。 JavaScript框架和库是封装好的代码集合,用来简化前端开发——…

    2025年12月21日
    000
  • React应用生产环境环境变量配置深度指南

    本文针对react应用在生产环境中无法读取`.env`文件配置的环境变量问题,深入剖析其工作原理、常见原因及排查方法。通过详细的步骤和示例代码,指导开发者正确配置和使用环境变量,解决api调用层面的`null`响应问题,确保应用在生产环境下的稳定运行。 在React应用开发中,环境变量(如API密钥…

    2025年12月21日
    000
  • JS注解怎么实现文档化_ JS注解生成开发文档的流程与工具

    JSDoc是一种JavaScript结构化注释规范,通过@param、@returns等标签描述代码元素,并借助工具生成HTML文档,结合IDE支持和CI/CD可提升团队协作效率。 JavaScript本身不支持原生注解(Annotation)像Java那样的语法,但通过约定的注释格式和配套工具,可…

    2025年12月21日
    000
  • JS注解怎么标注联合类型_ JS联合类型的注解书写与使用技巧

    在JavaScript中可通过JSDoc使用联合类型注解,如string|number表示多类型支持,结合@param、@typedef等标签提升代码可读性与编辑器提示,适用于函数参数、返回值等场景。 在JavaScript中,虽然原生不支持类型注解,但在使用JSDoc配合现代编辑器(如VS Cod…

    2025年12月21日
    000
  • VS Code主题开发:告别JSON,拥抱脚本化生成

    vs code主题扩展最终需json格式定义,但开发者可通过javascript或typescript等脚本语言生成此json文件。这种方法有效解决了大型json文件难以维护、不支持注释等问题,并能实现颜色动态计算,显著提升主题开发的灵活性与效率。 为什么选择脚本化生成VS Code主题? 在开发V…

    2025年12月20日
    000
  • 如何用Quasar框架开发一个跨平台应用?

    Quasar基于Vue.js用一套代码构建多平台应用,支持响应式网站、PWA、移动App和桌面应用。通过quasar create创建项目,利用模式(SPA、PWA、Electron等)切换目标平台,使用Quasar组件库编写通用UI,配合Pinia管理状态,最后通过不同构建命令发布到各平台,实现高…

    2025年12月20日
    000
  • 怎么利用JavaScript进行前端代码覆盖率统计?

    答案:利用JavaScript进行前端代码覆盖率统计的核心是通过Istanbul/nyc等工具对代码插桩,结合测试框架收集执行数据并生成报告。具体流程包括:在代码执行前通过Babel或Webpack插件(如babel-plugin-istanbul)插入计数器实现插桩;运行测试时记录哪些代码被执行;…

    2025年12月20日
    100
  • typescript中的参数分享

    TypeScript 中的参数共享允许组件间共享参数,实现跨组件状态维护和数据变更共享。通过 @Input 装饰器传递父组件参数,使用 @Output 装饰器定义子组件事件,以便在子组件状态改变时通知父组件。参数共享提高复用性,简化状态管理,允许子组件向父组件发出通知,但应谨慎使用,避免大量数据共享…

    2025年12月19日
    000
  • 手机如何运行typescript方法

    要在手机上运行 TypeScript 方法,可以使用 TypeScript 编译器或第三方库:TypeScript 编译器: 将 TypeScript 代码编译成 JavaScript,然后集成到移动应用程序中。第三方库: 如 React Native 或 NativeScript,允许使用 Typ…

    2025年12月19日
    000
  • typescript用来干嘛_typescript的作用

    TypeScript 是一种用于构建大型复杂应用程序的开源编程语言,它扩展了 JavaScript 的功能,具有以下作用:类型系统:编译时检查类型错误,提高代码可靠性。面向对象编程特性:支持类、接口、抽象类,增强代码组织性和维护性。模块系统:分解程序为可重用模块,提升可维护性和可扩展性。全面的类型推…

    2025年12月19日
    000
  • TypeScript基本用法和语法

    TypeScript 是一种具有类型系统的 JavaScript 超集,提供以下特性:类型注解:确保变量、函数和类的类型一致。接口:定义方法和属性,供类实现。枚举:提供命名常量集。泛型:创建可重用且类型安全的组件。 TypeScript 基本用法和语法 TypeScript 是一种超集 JavaSc…

    2025年12月19日
    000

发表回复

登录后才能评论
关注微信