整理自动驾驶端到端规划方法的综述

程序猿 • 2025年11月8日 08:29:13 • 用户投稿 • 阅读 0

本文为经自动驾驶之心公众号授权转载，转载请联系原文出处

一、Woven Planet（丰田子公司）的方案：Urban Driver 2021

这篇文章虽然是21年的，但很多新的文章都以它为对比基线，因此也有必要了解其方法

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

大概看了下，主要就是用Policy Gradients学习State->近期action的映射函数，有了这个映射函数，可以一步步推演出整个执行轨迹，最后loss就是让这个推演给出的轨迹尽可能的接近专家轨迹。

效果应该当时还不错，因此能成为各家新算法的基线。

二、南洋理工大学方案一 Conditional Predictive Behavior Planning with Inverse Reinforcement Learning 2023.04

先使用规则枚举了多种行为，生成了10~30条轨迹。（未使用预测结果）
使用Condtional Prediction算出每条主车待选轨迹情况下的预测结果，然后使用IRL对待选轨迹打分。

其中Conditional Joint Prediction模型长这样：

这个方法基本上很赞的点就是利用了Conditional Joint Prediction可以很好的完成交互性的预测，使得算法有一定的博弈能力。
但我个人认为算法缺点是前边只生成了10~30条轨迹，而且轨迹生成时没考虑预测，而且最后会直接在IRL打分后，直接选用这些轨迹中的一条作为最终结果，比较容易出现10~30条在考虑预测后发现都不大理想的情况。相当于要在瘸子里边挑将军，挑出来的也还是瘸子。基于这个方案，再解决前边待选样本生成质量会是很不错的路子

三、英伟达方案：2023.02 Tree-structured Policy Planning with Learned Behavior Models

用规则树状采样，一层一层的往后考虑，对每一层的每个子结点都生成一个conditional prediction，然后用规则对prediction结果和主车轨迹打分，并用一些规则把不合法的干掉，然后，利用DP往后生成最优轨迹，DP思路有点类似于apollo里dp_path_optimizer，不过加了一个时间维度。

不过因为多了一个维度，这个后边扩展次数多了之后，还是会出现解空间很大计算量过大的情况，当前论文里写的方法是到节点过多之后，随机丢弃了一些节点来确保计算量可控（感觉意思是节点过多之后可能也是n层之后了，可能影响比较小了）

本文主要贡献就是把一个连续解空间通过这种树形采样规则转变一个马尔可夫决策过程，然后再利用dp求解。

四、南洋理工大学&英伟达联合 2023年10月最新方案：DTPP: Differentiable Joint Conditional Prediction and Cost Evaluation for Tree Policy Planning in Autonomous Driving

看标题就感觉很Exciting：

一、Conditional Prediction确保了一定博弈效果
二、可导，能够整个梯度回传，让预测与IRL一起训练。也是能拼出一个端到端自动驾驶的必备条件
三、Tree Policy Planning，可能有一定的交互推演能力

法语写作助手

法语助手旗下的AI智能写作平台，支持语法、拼写自动纠错，一键改写、润色你的法语作文。

31 查看详情

仔细看完，发现这篇文章信息含量很高，方法很巧妙。

经过对英伟达的TPP和南洋理工的Conditional Predictive Behavior Planning with Inverse Reinforcement Learning进行糅合改进，成功解决了之前南洋理工论文中待选轨迹不好的问题

论文方案的主要模块包括：

一、Conditional Prediction模块，输入一条主车历史轨迹+提示轨迹 + 障碍车历史轨迹，给出主车接近提示轨迹的预测轨迹和与主车行为自洽的障碍车的预测轨迹。
二、打分模块，能够给一个主车+障碍车轨迹打分看这个轨迹是否像专家的行为，学习方法是IRL。
三、Tree Policy Search模块，用来生成一堆待选轨迹

采用Tree Search算法来探索主车的可行解，探索过程中每一步都将已经探索出来的轨迹作为输入，利用Conditional Prediction算法生成主车和障碍车的预测轨迹，并调用打分模块评估轨迹的优劣，从而影响下一步搜索扩展节点的方向。通过这种方法，可以生成一些与其他方案不同的主车轨迹，并且在轨迹生成时考虑与障碍车之间的交互

传统的IRL都是人工搞了一大堆的feature，如前后一堆障碍物在轨迹时间维度上的各种feature（如相对s, l和ttc之类的），本文里为了让模型可导，则是直接使用prediction的ego context MLP生成一个Weight数组(size = 1 * C)，隐式表征了主车周围的环境信息，然后又用MLP直接接把主车轨迹+对应多模态预测结果转成Feature数组(size = C * N, N指的待选轨迹数)，然后两个矩阵相乘得到最终轨迹打分。然后IRL让专家得分最高。个人感觉这里可能是为了计算效率，让decoder尽可能简单，还是有一定的主车信息丢失，如果不关注计算效率，可以用一些更复杂一些的网络连接Ego Context和Predicted Trajectories，应该效果层面会更好？或者如果放弃可导性，这里还是可以考虑再把人工设置的feature加进去，也应该可以提升模型效果。

在时间方面，该方案采用了一次重编码 + 多次轻量化解码的方法，成功地减少了计算延迟。文章中指出，延迟可以压缩到98毫秒

在learning based planner中属于SOTA行列，闭环效果接近前一篇文章中提到的nuplan 排第一的Rule Based方案PDM。

总结

看下来，感觉这么个范式是挺不错的思路，中间具体过程可以自己想办法调整：

用预测模型指导一些规则来生成一些待选ego轨迹对每条轨迹，用Conditional Joint Prediction做交互式预测，生成agent预测。可以提升博弈性能。IRL等方法做利用Conditional Joint Prediction结果对前边的主车轨迹打分，选出最优轨迹

需要重新书写的内容是：原文链接：https://mp.weixin.qq.com/s/ZJtMU3zGciot1g5BoCe9Ow

以上就是整理自动驾驶端到端规划方法的综述的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/473458.html

技术自动驾驶

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

如何在VSCode中定制Laravel项目启动器 Laravel项目初始化插件开发指南

上一篇 2025年11月8日 08:29:11

如何使用OpenSSL在Linux上进行文件加密

下一篇 2025年11月8日 08:29:18

用户投稿

推荐有效的工具和技术来进行网站性能优化

随着互联网的快速发展，越来越多的企业将自己的业务扩展到了网上。然而，随之而来的问题是网站的性能优化。一个高效的网站能够提高用户体验，增加访问量以及销售额。为了达到这些目标，下面将要介绍一些有效的工具和技术来帮助您对网站进行性能优化。页面压缩：页面压缩是通过减少文件大小来提高页面加载速度的一种方法。…

程序猿
2025年12月22日
6000
用户投稿

实现响应式布局的技术和策略

如何实现响应式布局的技术与方法引言：随着移动设备的普及和多种终端的涌现，实现响应式布局已成为现代网页开发的重要一环。响应式布局可以使网页在不同的屏幕尺寸下自动适应，提供更好的用户体验。本文将介绍响应式布局的技术与方法，并提供具体的代码示例。一、媒体查询（Media Queries）媒体查询是实现…

程序猿
2025年12月21日
0000
用户投稿

静态重定位技术的原理及其应用案例

静态重定位技术的原理和应用引言：在现代计算机系统中，内存管理是一个非常重要的课题。随着软件的复杂性和规模的增加，内存的限制成为了我们面临的一个挑战。为了更高效地利用内存资源，静态重定位技术应运而生。本文将介绍静态重定位技术的原理、应用以及提供一些具体的代码示例。一、静态重定位技术的原理静态重定位…

程序猿
2025年12月21日
0000
用户投稿

分析静态定位技术的优缺点

静态定位技术的优势与局限性分析随着现代科技的发展，定位技术已经成为我们生活中不可或缺的一部分。而静态定位技术作为其中的一种，具有其特有的优势和局限性。本文将对静态定位技术进行深入分析，以便更好地了解其应用现状和未来的发展趋势。首先，我们来看一下静态定位技术的优势所在。静态定位技术是通过对待定位对…

程序猿
2025年12月21日
0000
用户投稿

优化网页设计的方法——静态定位的应用技巧

在现代互联网领域中，网页设计是一个至关重要的领域。深入探究网页设计的方方面面，现代设计师越来越意识到静态定位技术的重要性。静态定位技术可以使得网页设计更灵活，更符合用户的需求，从而大大提高用户对于网页的满意度与使用体验。本文将探究静态定位技术的作用，以及如何在网页设计中去优化与应用静态定位技术。一…

程序猿
2025年12月21日
7000
用户投稿

用Canvas技术打造引人入胜的动态效果，轻松get！

轻松掌握Canvas技术，打造炫酷动态效果 Canvas是HTML5中一项功能强大的绘图技术，可以实现各种炫酷的动态效果。本文将带你一步步学习Canvas的基本用法，并提供具体的代码示例，让你轻松掌握这项技术。一、Canvas简介 Canvas是HTML5中的一个元素，用于在网页上绘制图形、动画等…

程序猿
2025年12月21日
0000
用户投稿

了解canvas的JS技术：你熟知哪些呢？

探究canvas的JS技术：你知道有哪些吗？简介在现代Web开发中，JavaScript已经成为不可或缺的一部分。作为一种脚本语言，它可以为网页添加交互性和动态性。而在JS技术中，canvas则是一个重要的API之一。本文将带您深入了解canvas的JS技术，并介绍一些常用的canvas相关功能…

程序猿
2025年12月21日
8000
再谈前端HTML模板技术

这篇文章介绍的内容是关于再谈前端HTML模板技术，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下在web2.0之前，写jsp的时候虽然有es和JSTL，但是还是坚持jsp。后面在外包公司为了快速交货，还是用了php Smart技术。 web2.0后，前端模板技术风行。代表有如下三大…

程序猿
2025年12月21日 • 用户投稿
5000
用户投稿

如何搭建C++自动驾驶环境 Apollo平台配置

搭建C++自动驾驶环境需先配置Ubuntu系统、Docker及NVIDIA驱动，再克隆Apollo代码并构建Docker镜像，进入容器后用bazel编译，启动Dreamview可视化界面，选择地图与模块运行Demo；常见问题如编译失败可清理缓存或更新依赖，自定义车辆模型和地图需掌握URDF与prot…

程序猿
2025年12月18日
0000
如何配置C++的自动驾驶规划环境 Apollo规划模块二次开发

为什么apollo规划模块的二次开发需要特定的环境配置？apollo使用docker和bazel是为了处理复杂的依赖关系、确保构建一致性、支持gpu加速以及提升团队协作效率。2. 在apollo环境中进行规划模块二次开发的关键步骤包括：准备宿主机环境、克隆apollo仓库、进入docker环境、编译…

程序猿
2025年12月18日 • 用户投稿
0000
自动驾驶实时系统：确定性内存分配器开发指南

自动驾驶实时系统对确定性内存分配器的需求，是为了确保内存操作在可预测时间内完成，从而保障系统的稳定与安全。1. 预分配和内存池通过预先分配固定大小的内存块，实现o(1)时间复杂度的快速分配与释放，但可能导致内存浪费；2. bump allocator使用移动指针的方式实现极快的分配，但通常不支持单独…

程序猿
2025年12月18日 • 用户投稿
0000
用户投稿

如何在C++中进行自动驾驶和智能导航开发？

如何在C++中进行自动驾驶和智能导航开发？自动驾驶和智能导航是当今科技发展的热门领域之一。随着计算机硬件技术的快速发展和算法的不断完善，C++语言在自动驾驶和智能导航领域的应用越来越广泛。本文将介绍如何在C++中进行自动驾驶和智能导航的开发，并提供代码示例。传感器数据获取与处理自动驾驶和智能导…

程序猿
2025年12月17日
0000
用户投稿

如何实现C++中的自动驾驶和智能交通系统？

如何实现C++中的自动驾驶和智能交通系统？自动驾驶和智能交通系统是目前人工智能领域的热门话题，它们的应用领域涉及到交通运输、安全防护和城市规划等多个方面。本文将探讨如何使用C++编程语言实现自动驾驶和智能交通系统，并提供相关的代码示例。了解自动驾驶和智能交通系统基本原理自动驾驶系统是指通过计算机…

程序猿
2025年12月17日
1000
用户投稿

XML数据绑定技术有哪些

XML数据绑定技术通过将XML与程序对象映射，提升开发效率与代码可读性，主要分为基于XSD生成代码（如JAXB）和基于注解运行时绑定（如Simple XML）两类；选择时需权衡Schema稳定性、性能、开发效率及框架成熟度；相比手动解析，其优势在于类型安全、低维护成本，但面临大文件内存开销与复杂结构…

程序猿
2025年12月17日
0000
用户投稿

Python开发建议：掌握常用的调试工具和技术

Python作为一种强大、灵活的编程语言，被广泛应用于各种软件开发领域。然而，许多开发者在学习和使用Python时，往往忽略了调试技术的重要性。调试是软件开发过程中不可或缺的一部分，它可以帮助开发者找到和解决代码中的问题，提高开发效率，保证软件质量。因此，掌握常用的调试工具和技术对于Python开发…

程序猿
2025年12月13日
1000
用户投稿

Python底层技术揭秘：如何实现图像处理

Python底层技术揭秘：图像处理的实现及代码示例导语：图像处理是计算机科学中十分重要的一个领域。通过使用Python以及相关的底层技术，我们能够实现各种各样的图像处理操作。在本文中，我们将揭示Python图像处理的底层技术，并提供一些实用的代码示例。一、Python图像处理的基础知识在开始探讨…

程序猿
2025年12月13日
0000
用户投稿

Python底层技术揭秘：如何实现哈希算法

Python底层技术揭秘：如何实现哈希算法，需要具体代码示例摘要：哈希算法是计算机领域中常用的技术之一，用于快速确定数据的唯一标识。Python作为一门高级语言，提供了许多内建的哈希函数，如hash()函数以及各种散列算法的实现。本文将揭示哈希算法的原理和Python底层实现的细节，并提供具体的代…

程序猿
2025年12月13日
0000
用户投稿

苹果发布 Safari 技术预览版 223：聚焦稳定性与性能优化

近日，苹果公司推出了 safari 技术预览版的最新版本 223，该版本属于其专为开发者和早期用户打造的实验性浏览器更新。本次更新的重点在于修复已知问题并提升性能表现，目的是为未来正式版 safari 浏览器打下更坚实的基础。自 2016 年首次发布以来，Safari 技术预览版一直是开发者测试 …

程序猿
2025年12月2日
0000
无需电池即可实现「自动驾驶」，华盛顿大学开发出无限续航的机器人

不装电池，也能%ignore_a_1%的“车”出现了。甚至还会自动收集能量持续运行，完全没有里程焦虑（手动狗头）。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 不错，这么一个小机器人，其实靠的是光和无线电波供能。其名MilliMobil…

程序猿
2025年12月2日 • 用户投稿
0000
BEV下的Radar-Camera 融合跨数据集实验研究

原标题：cross-dataset experimental study of radar-camera fusion in bird’s-eye view论文链接：https://arxiv.org/pdf/2309.15465.pdf作者单位：opel automobile gmbh rhein…

程序猿
2025年12月2日 • 用户投稿
0000