SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

原标题:simpl: a simple and efficient multi-agent motion prediction baseline for autonomous driving

论文链接:https://arxiv.org/pdf/2402.02519.pdf

代码链接:https://github.com/HKUST-Aerial-Robotics/SIMPL

作者单位:香港科技大学 大疆

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

论文思路:

本文提出了一种用于自动驾驶车辆的简单高效的运动预测基线(SIMPL)。与传统的以代理为中心(agent-centric) 的方法(精度高但需要重复计算)和以场景为中心(scene-centric) 的方法(精度和通用性受到影响)不同,SIMPL 可以为所有相关交通参与者提供实时、准确的运动预测。为了提高准确性和推理速度,本文提出了一种紧凑而高效的全局特征融合模块,该模块以对称方式执行定向消息传递,使网络能够在单次前馈传递中预测所有道路使用者的未来运动,并减轻视点移动导致的精度损失。此外,本文研究了在轨迹解码中使用 Bernstein basis polynomials 进行连续轨迹参数化,允许在任何所需时间点评估状态及其高阶导数,这对于下游规划任务很有价值。作为强大的基线,与其他最先进的方法相比,SIMPL 在 Argoverse 1 和 2 运动预测基准上表现出极具竞争力的性能。此外,其轻量级设计和低推理延迟使 SIMPL 具有高度可扩展性,并有望用于现实世界的机载部署。

网络设计:

预测周围交通参与者的运动对自动驾驶汽车至关重要,尤其是在下游决策和规划模块中。准确预测意图和轨迹将提高安全性和乘坐舒适性。

对于基于学习的运动预测,最重要的主题之一是上下文表示。早期的方法通常将周围场景表示为多通道鸟瞰图像 [1]–[4]。相比之下,最近的研究越来越多地采用矢量化场景表示[5]-[13],其中使用带有地理坐标的点集或多段线(polylines) 来标注位置和几何形状,从而提高保真度并扩大感受野。然而,对于光栅化和矢量化表示,都存在一个关键问题:我们应该如何为所有这些元素选择合适的参考系?一种直接的方法是描述共享坐标系(以场景为中心)内的所有实例,例如以自动驾驶车辆为中心的坐标系,并直接使用坐标作为输入特征。这使我们能够在一次前馈传递中对多个目标代理进行预测 [8, 14]。然而,使用全局坐标作为输入,通常会在单个前馈传递中对多个目标代理进行预测 [8, 14]。然而,使用全局坐标作为输入(通常会在很大范围内变化)将大大加剧任务的固有复杂性,导致网络性能下降和对新场景的适应性有限。为了提高准确性和鲁棒性,一种常见的解决方案是根据目标代理的当前状态对场景上下文进行归一化处理 [5, 7, 10]-[13](以代理为中心)。这意味着必须对每个目标代理重复执行归一化过程和特征编码,从而获得更好的性能,但代价是冗余计算。因此,有必要探索一种能够有效地编码多个目标的特征,同时保持对视角(perspective) 变化的鲁棒性的方法。

对于运动预测的下游模块,例如决策和运动规划,不仅需要考虑未来位置,还需要考虑航向、速度和其他高阶导数。例如,周围车辆的预测航向在塑造未来时空占用方面发挥着关键作用,这是确保安全和稳健的运动规划的关键因素[15, 16]。此外,在不遵守物理约束的情况下独立预测高阶量可能会导致预测结果不一致[17, 18]。例如,尽管速度为零,但它可能会产生位置位移,从而导致规划模块混乱。

本文介绍了一种名为SIMPL(简单高效的运动预测基线)的方法,用于解决自动驾驶系统中多智能体轨迹预测的关键问题。该方法首先采用以实例为中心的场景表示,然后引入了symmetric fusion Transformer(SFT)技术,能够在单次前馈传递中有效地预测所有代理的轨迹,同时保持视角不变性的准确性和鲁棒性。与其他基于对称上下文融合的方法相比,SFT更简单、更轻量级且更易实现,适合在车载环境中部署使用。

其次,本文引入了一种基于 Bernstein basis polynomial(也称为 Bezier curve)的预测轨迹的新颖参数化方法。这种连续表示确保了平滑性,并能够在任何给定时间点轻松评估精确状态及其高阶导数。本文的实证研究表明,与估计 monomial basis polynomials 的系数相比,学习预测 Bezier curves 的控制点更加有效且数值稳定。

表单大师AI 表单大师AI

一款基于自然语言处理技术的智能在线表单创建工具,可以帮助用户快速、高效地生成各类专业表单。

表单大师AI 74 查看详情 表单大师AI

最后,所提出的组件被很好地集成到一个简单而高效的模型中。本文在两个大型运动预测数据集上评估了所提出的方法[22, 23],实验结果表明,尽管 SIMPL 具有简化的设计,但与其他最先进的方法相比仍具有很强的竞争力。更重要的是,SIMPL通过较少的可学习参数和较低的推理延迟实现了高效的多智能体轨迹预测,而没有牺牲量化性能,这对于真实世界的机载部署来说是充满希望的。本文还强调,作为一个强大的基线,SIMPL 具有出色的可扩展性。简洁的架构便于与最新的运动预测进展直接整合,为进一步提高整体性能提供了机会。

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

图 1:复杂驾驶场景中多智能体运动预测的图示。本文的方法能够实时地同时为所有相关代理生成合理的假设。自车和其他车辆分别以红色和蓝色显示。根据时间戳使用渐变颜色来可视化预测轨迹。请参考附带的视频了解更多示例。

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

图 2:SIMPL 示意图。本文利用尽可能简单的网络架构来证明其有效性。语义实例的局部特征由简单的编码器处理,而实例间特征则保留在相对位置嵌入中。多模态轨迹预测结果由运动解码器在提出的 symmetric feature Transformer 之后生成。

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

图 3:相对位姿计算示意图。

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

图 4:所提出的 L 层 symmetric fusion Transformer (SFT) 的图示。实例 tokens 和相对位置嵌入(RPE)在每个SFT层中都会循环更新。

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

图 5:2D septic Bezier curve(左)。

实验结果:

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准

总结:

本文提出了一种简单高效的自动驾驶多智能体运动预测基线。利用所提出的 symmetric fusion Transformer,所提出的方法实现了高效的全局特征融合,并保持了针对视点移动的鲁棒性。基于 Bernstein basis polynomials 的连续轨迹参数化提供了与下游模块更高的兼容性。在大规模公共数据集上的实验结果表明,SIMPL 在模型大小和推理速度方面更具优势,同时获得与其他最先进方法相同水平的精度。

引用:

Zhang L, Li P, Liu S, et al. SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving[J]. arXiv preprint arXiv:2402.02519, 2024.

以上就是SIMPL:用于自动驾驶的简单高效的多智能体运动预测基准的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/621725.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 06:54:06
下一篇 2025年11月11日 06:58:00

相关推荐

  • 无需电池即可实现「自动驾驶」,华盛顿大学开发出无限续航的机器人

    不装电池,也能%ignore_a_1%的“车”出现了。 甚至还会自动收集能量持续运行,完全没有里程焦虑(手动狗头)。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 不错,这么一个小机器人,其实靠的是光和无线电波供能。其名MilliMobil…

    2025年12月2日 科技
    000
  • BEV下的Radar-Camera 融合跨数据集实验研究

    原标题:cross-dataset experimental study of radar-camera fusion in bird’s-eye view论文链接:https://arxiv.org/pdf/2309.15465.pdf作者单位:opel automobile gmbh rhein…

    2025年12月2日 科技
    000
  • 遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

    回归到地面的高度,以实现距离不可知的公式,从而简化仅相机感知方法的优化过程。在路侧camera的3d检测基准上,方法大大超过了以前所有以视觉为中心的方法。它比bevdepth产生了+1.9%的nds和+1.1%的map的显著改善。在nuscenes测试集上,方法取得了实质性的进步,nds和map分别…

    2025年12月2日 科技
    000
  • 改进自动驾驶在不确定环境下的轨迹规划方法

    论文题目:《基于改进的模型预测控制的自动驾驶车辆在不确定环境下的轨迹规划方法》 发表期刊:IEEE Transactions on Intelligent Transportation Systems 发布日期:2023年04月 以下是我自己的論文閱讀筆記,主要是我自己覺得重點的部分,非全文翻譯,該…

    2025年12月2日 科技
    000
  • LeCun对自动驾驶独角兽的造假行为深感失望

    你以为这是一个普通的自动驾驶视频吗? ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 这个内容需要重新写成中文,而不改变原来的意思 没有一帧是“真的”。 图片 不同路况、各种天气,20多种情况都能模拟,效果以假乱真。 图片 世界模型再次…

    2025年12月2日 科技
    000
  • 实战部署:动态时序网络用于端到端检测和跟踪

    本文经自动驾驶之心公众号授权转载,转载请联系出处。 相信除了少数自研芯片的大厂,绝大多数自动驾驶公司都会使用英伟达NVIDIA芯片,那就离不开TensorRT. TensorRT是在NVIDIA各种GPU硬件平台下运行的一个C++推理框架。我们利用Pytorch、TF或者其他框架训练好的模型,可以首…

    2025年12月2日 科技
    000
  • 自动驾驶中的交通规则识别问题

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 自动驾驶中的交通规则识别问题,需要具体代码示例 摘要:自动驾驶技术正在迅速发展,并且在未来有望实现商业化应用。然而,与此同时,自动驾驶车辆面临着一个重要的挑战,即交通规则的识别和遵守问题。本文将…

    2025年12月1日 科技
    000
  • 自动驾驶与轨迹预测看这一篇就够了!

    轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(cnn&gnn&…

    2025年12月1日 科技
    000
  • 2024年自动驾驶标注行业是否会被世界模型所颠覆?

    1.数据%ignore_a_1%面临的问题(特别是基于BEV 任务) 随着基于BEV transformer 任务的兴起,随之带来的是对数据的依赖变的越来越重,基于BEV 任务的标注也变得越来越重要。目前来看无论是2D-3D的联合障碍物标注,还是基于重建点云的clip 的车道线或者Occpuancy…

    2025年12月1日 科技
    000
  • “真假难辨”!巧用NeRF生成的自动驾驶仿真数据

    写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的前奏的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式感知真实数据和渲染数据。尽管渲染方法的性能正在提高,但许多场景在忠实重建方面仍然具有固有的挑战性。为…

    2025年12月1日 科技
    000
  • RV融合性能拉爆!RCBEVDet:Radar也有春天,最新SOTA!

    写在前面&笔者的个人理解 这篇讨论文关注的主要问题是3D目标检测技术在自动驾驶进程中的应用。尽管环境视觉相机技术的发展为3D目标检测提供了高分辨率的语义信息,这种方法因无法精确捕获深度信息和在恶劣天气或低光照条件下的表现不佳等问题而受限。针对这一问题,讨论提出了一种结合环视相机和经济型毫米波…

    2025年12月1日 科技
    000
  • 马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 他强调特斯拉已经接近实现无人干预的全%ignore_a_1%状态,并指出了全自动驾驶的实用性和提高汽车使用率的重要性。马斯克同时表示特斯拉对于与其他汽车制造商分享和许可自动驾驶技术非常感兴趣。 …

    2025年12月1日 科技
    000
  • Gary Marcus:自动驾驶汽车状况频出,仍未赢得认可

    2016年,《纽约时报》一篇关于%ign%ignore_a_1%re_a_1%汽车的文章开头写道:“自动驾驶汽车时代已经到来,一些汽车制造商已投资数十亿美元进行研发……并在美国的一些城市开始测试。”经过7年的时间,自动驾驶技术取得了哪些进展呢? 纽约大学的心理学和神经科学荣誉教授Gary Marcu…

    2025年12月1日 科技
    000
  • 英国拟出新规,特斯拉或面临自动驾驶汽车禁售

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 据消息称,英国将出台《自动驾驶汽车法案》,特斯拉有可能被禁止在英国销售自动驾驶汽车。此举将给埃隆·马斯克和特斯拉带来重大挫折 英国交通运输部计划明年发布相关法规,规定未经批准的汽车制造商不得将车…

    2025年12月1日 科技
    000
  • 初学者必备,NeRF学习笔记洞察一切!

    神经辐射场究竟是什么 辐射场:由光源发出的光线在场景中的传播和反射过程中所形成的能量分布。通俗来说就是一个函数,记录了空间某个位置处向某个方向的辐射信息,辐射信息(或者说能量分布)其实就是颜色、亮度、阴影等信息。这里的方向需要额外留意,它是nerf实现真实重建的重要因素之一! 由此引出神经辐射场的概…

    2025年12月1日 科技
    000
  • 人工智能如何为未来智能大众出行解决方案铺平道路

    预计到2030年,有60%的人口将生活在城市地区。为了实现城镇化的进步,高效的人员流动至关重要。在各种公共交通方式中,铁路被认为是每乘客公里能源消耗最高效、最有效的选择。这是因为铁路系统不仅可以大大缓解城市拥堵问题,还能减少环境污染和交通事故的发生率。提升铁路网络的质量和覆盖范围,将有助于促进城市发…

    2025年12月1日 科技
    000
  • 清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力

    在自动驾驶领域,研究人员也在朝着 gpt/sora 等大模型方向进行探索。 与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。…

    2025年12月1日 科技
    000
  • 特斯拉:坚持视觉处理方案

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 近日,%ignore_a_1%官方发布声明,强调继续采用视觉处理方案,致力于让每个人都能负担得起安全且智能的产品。通过特斯拉的视觉处理方案和端到端神经网络,结合数十亿真实世界数据样本的训练,实现…

    2025年12月1日
    000
  • 全球首个,中国将主持编制铁路自动驾驶国际标准

    本站 7 月 11 日消息,据中国铁道建筑报报道,日前,在瑞典斯德哥尔摩召开的国际标准化组织 ISO / TC269 / SC3 第 9 次全体大会上,经过法国、德国、日本等 13 个国家的专家及 UIC 观察员全体投票,一致同意通过了由中国铁建铁四院技术专家冯梅牵头的《应用自动驾驶模式的运营规则导…

    2025年11月29日 行业动态
    000
  • 前特斯拉总监、OpenAI大牛Karpathy:我被自动驾驶分了心,AI智能体才是未来!

    近日,OpenAI联合创始人,曾经TeslaAI总监,现在又重新返回OpenAI的Andrej Karpathy在一个开发者活动上,分享了自己对于AI智能体的看法。 7年前,研究AI智能体的时机还不成熟 他先聊到了自己早期在OpenAI工作时(2016年左右),当时的业界潮流就是研究如何用强化学习的…

    2025年11月28日 科技
    000

发表回复

登录后才能评论
关注微信