
北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)对外宣布,其自主研发的具身智能策略框架 FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency 已被人工智能领域顶级会议 NeurIPS 接收。
据悉,FreqPolicy 的核心突破在于首次提出频谱一致性约束机制,从频域视角重新构建了具身智能机器人的动作时序建模方式。该框架通过在策略生成过程中引入动作信号的频域表征,实现了“单步输出高质量动作序列”的能力,显著增强了机器人操作的流畅性与执行效率。
在人工智能加速向物理世界落地的趋势下,FreqPolicy 针对高效具身操作任务展开研究,采用一步生成架构,大幅提升了动作预测与控制的频率,满足机器人系统在高动态、高实时性场景下的响应需求,尤其适用于复杂环境中的自适应操控任务。
FreqPolicy 将动作块(action chunk)利用 DCT-II 变换转换至频域空间,并在此空间施加一致性约束,以更有效地捕捉动作的时间动态特性。同时,该框架设计了针对频域分量的自适应注意力机制,使其能够在频谱范围内灵活聚焦关键频率成分。上述设计帮助模型学习到更优的动作转移路径,最终实现从噪声直接生成目标动作的一体化过程。
在多个仿真基准测试中,FreqPolicy 表现出色。相比当前最先进的单步动作生成方法,在 Robomimic 基准上平均性能提升 6%,在 MetaWorld 基准上平均提升达 8.9%。此外,当与 OpenVLA 等视觉-语言-动作(VLA)模型集成时,FreqPolicy 在保持操作精度的同时,将推理速度提升至原有水平的 5 倍。
文心智能体平台
百度推出的基于文心大模型的Agent智能体平台,已上架2000+AI智能体
0 查看详情

在真实机器人应用场景中,FreqPolicy 展现出广泛的适用性,涵盖桌面操作、家庭服务及工业自动化等任务场景。实验结果显示,其任务成功率优于传统的扩散策略和标准流匹配策略,且推理频率实现 3 到 5 倍的提升。
展望未来,北京人形机器人创新中心将持续优化 FreqPolicy 框架,进一步增强其对多模态动作分布的建模能力,并加快推理效率,推动其在更高复杂度真实场景中的落地应用。
以上就是北京人形提出具身智能策略框架 FreqPolicy的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/211716.html
微信扫一扫
支付宝扫一扫