DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

detzero:waymo在3d检测榜单上位列第一,与人工标注媲美!detzero:waymo在3d检测榜单上位列第一,与人工标注媲美!

本文提出了一套离线3D物体检测算法框架DetZero,通过在 Waymo 公开数据集上进行全面的研究和评估,DetZero可生成连续且完整的物体轨迹序列,并充分利用长时序点云特征显着提升感知结果的质量。同时以 85.15 mAPH (L2) 的性能在 WOD 3D 物体检测排行榜上取得排名第一。此外,DetZero可以为在线模型的训练提供高质量的自动标签,其结果已经达到甚至高于人工标签的水平。

这是论文链接:https://arxiv.org/abs/2306.06023

需要重新写的内容是:代码链接:https://github.com/PJLab-ADG/DetZero

请访问主页链接:https://superkoma.github.io/detzero-page

1 引言

为了提高数据标注的效率,我们研究了一种新的方法。这种方法基于深度学习和无监督学习,可以自动生成标注数据。通过使用大量的未标注数据,我们可以训练一个自动驾驶感知模型,使其能够识别和检测道路上的物体。这种方法不仅可以减少标注数据的成本,还可以提高后处理的效率。我们在实验中使用了Waymo的离线3D物体检测方法3DAL[]作为基准进行比较,结果表明我们提出的方法在准确性和效率方面都有显著的改进。我们相信这种方法将在未来的自动驾驶技术中发挥重要作用

目标检测(Detection):输入少量连续的点云帧数据,输出每一帧中3D物体的边界框和类别信息;多目标跟踪(Tracking):将每一帧检测到的物体进行关联,形成物体序列,并分配唯一的物体ID;运动状态分类(Motion Classification):基于物体轨迹特征,确定物体的运动状态(静止或运动);物体为中心的优化(Object-centric Refining):根据前一模块预测的运动状态,分别提取静止和运动物体的时序点云特征,以预测准确的边界框。最终,通过姿态矩阵将优化后的3D边界框转移回该物体所在的每一帧坐标系中。

然而,很多主流的在线3D目标检测方法通过利用点云的时序上下文特征,取得了比现有的离线3D检测方法更好的效果。然而,我们意识到这些方法未能有效地利用长序列点云的特征

目前的目标检测和跟踪算法主要关注边界框层面(box-level)的性能指标,将在线的3D检测算法经过TTA和多模型融合之后所产生的大量冗余框作为跟踪算法的输入,通常很容易引发严重的轨迹分段、ID切换以及错误关联等问题,无法保证连续、完整的物体序列的生成,进而妨碍利用物体对应的长时序点云特征。如下图所示,原本一个物体的轨迹被分割成多个子序列(T1, T2, T3),导致拥有更多信息的T1片段的特征无法共享到T2和T3中;T4片段中经过优化的框也无法召回已经丢失掉的片段;T5片段中经过优化的框在转移到原先是FP的位置后依然是FP。

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!物体序列的质量会对下游的优化模型产生很大的影响

基于运动状态分类的优化模型没有充分利用到物体的时序特征。例如,刚性物体的尺寸大小随时间保持一致,通过从不同角度捕捉数据可以实现更准确的尺寸估计;物体的运动轨迹应当遵循一定的运动学约束,表现为轨迹的平滑性。如下图(a)所示,对于动态物体来说,基于滑动窗口的优化机制未考虑物体几何形状的一致性,仅通过邻近几帧的时序点云信息对边界框进行更新,导致预测的几何尺寸出现偏差。而在(b)的例子中,通过把该物体的点云全部聚合在一起,可获得稠密的时序点云特征,为每一帧都预测出边界框的准确的几何尺寸。

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!基于运动状态的优化模型预测物体的尺寸(a),几何优化模型将不同视角的点云全部聚合后预测物体的尺寸(b)

2 方法

本文提出了一个名为DetZero的新离线3D物体检测算法框架。该框架具有以下特点:(1)使用多帧3D检测器和离线跟踪器作为上游模块,以提供准确和完整的物体跟踪,重点关注物体序列的高召回率(track-level recall);(2)下游模块包括基于注意力机制的优化模型,利用长时序点云特征分别学习预测物体的不同属性,包括精细化几何尺寸、平滑运动轨迹位置以及更新置信度分数

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!

2.1 生成完整的物体序列

我们采用公开的CenterPoint[]作为基础检测器,为了提供更多的检测候选框,我们在三个方面进行了加强:(1)将不同帧点云组合作为输入,最大化性能而不降低性能;(2)使用点云密度信息将原始点云特征和体素特征融合为二阶段模块,以优化一阶段的边界结果;(3)使用推理阶段数据增强(TTA)、多模型结果融合(Ensemble)等技术来提高模型对复杂环境的适应能力

离线跟踪模块中引入了两阶段关联策略以减少错误匹配,根据置信度将框分为高分组和低分组,对高分组进行关联更新现有轨迹,未更新的轨迹与低分组关联。同时,物体轨迹的长度可持续至序列终止,避免ID切换问题。此外,我们会反向执行跟踪算法生成另一组轨迹,并通过位置相似性关联,最后用WBF策略融合匹配成功的轨迹,进一步提升序列首尾的完整性。最后,对于区分好的物体序列,提取出其对应的每一帧点云进行保存;而未更新的冗余框和一些较短的序列和会直接合并至最终的输出,无需下游优化。

2.2 基于属性预测的物体优化模块

以前的以物体为中心的优化模型忽略了物体之间在不同运动状态下的相关性,例如几何形状的一致性以及相邻时刻的物体运动状态的一致性。基于这些观察,我们将传统的边界框回归任务分解为三个模块:分别预测物体的几何形状、位置和置信度属性

美间AI 美间AI

美间AI:让设计更简单

美间AI 45 查看详情 美间AI 多视角几何交互:通过拼接多个视角的物体点云,可以补全物体的外观和形状。首先进行局部坐标变换,将物体点云与不同位置的局部框对齐,并计算出每个点到边界框6个表面的投影距离,加强边界框的信息表征,随后直接合并不同帧的所有点云作为多视角几何特征的key和value,同时从物体序列中随机选择t个样本作为单视角几何特征的query。几何query会被送入自注意力层来查看彼此之间的差异性,随后被送入交叉注意力层来补充所需要视角的特征,并预测出精确的几何尺寸。局部与全局位置的交互:随机选择物体序列中的任意框作为原点,将所有其他框和对应的物体点云转移到此坐标系下,并计算出每个点到各自边界框中心点和8个角点的距离,作为全局位置特征的key和value。物体序列中的每一个样本都会作为位置query,送入自注意力层来判断当前位置与其他位置的相对距离,随后输入交叉注意力层模拟局部到全局位置的上下文关系,并预测出此坐标系下每个初始中心点与真值中心点之间的偏移量,以及航向角差异。置信度优化:分类分支用于分类该物体是TP还是FP,IoU回归分支预测出一个物体在被几何模型和位置模型优化后,与真值框之间的IoU大小。最终的置信度得分就是这两个分支的几何平均值。

3 实验

3.1 主要性能

DetZero在Waymo 3D检测排行榜上以85.15 mAPH (L2)取得了最佳成绩,无论是与处理长时序点云的方法相比,还是与最先进的多模态融合3D检测器相比,DetZero都展现出了显著的性能优势

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!Waymo 3D检测排行榜结果,所有结果均使用TTA或ensemble技术,†指离线模型,‡指点云图像融合模型,*表示匿名提交结果

同样,得益于检测框的准确性和物体跟踪序列的完整性,我们以75.05 MOTA(L2)取得了Waymo 3D跟踪排行榜上的性能第一。

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!Waymo 3D跟踪排行榜,*表示匿名提交结果

3.2 消融实验

为了更好地验证我们提出的每个模块的作用,我们在Waymo验证集上进行了消融实验,并且采用了更严格的IoU阈值作为衡量标准

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!在Waymo验证集上对Vehicle和Pedestrian进行,IoU阈值分别选取标准值(0.7 & 0.5)和严格值(0.8 & 0.6)

同时,对于同一组检测结果,我们分别选择3DAL中的跟踪器和优化模型与DetZero进行交叉组合验证,结果进一步证明DetZero的跟踪器和优化器性能更好,且二者组合在一起后发挥出更大的优势。

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!不同上下游模块组合的交叉验证实验,下角标1和2分别代表3DAL和DetZero,指标是3D APH

我们的离线追踪器更注重物体序列的完整性,虽然两者的MOTA性能差异很小,但是Recall@track的性能却是导致最终优化性能差异很大的一个原因

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!离线跟踪器(Trk2)与3DAL跟踪器(Trk1)的性能对比,性能为MOTA和Recall@track

此外,与其他最先进的跟踪器相比,也能证明这一点

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!Recall@track是经过跟踪算法处理后的序列召回,3D APH是经过同一个优化模型处理后的最终性能

3.3 泛化性能

为了验证我们的优化模型是否能够固定拟合到特定的上游结果集,我们选择了具有不同性能的上游检测跟踪结果作为输入。结果显示,我们取得了明显的性能提升,进一步证明了只要上游模块能够召回更多更完整的物体序列,我们的优化器就能够有效地利用其时序点云的特征进行优化

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!Waymo验证集上的泛化性能验证,指标是3D APH

3.4 与人类标注能力进行对比

我们将根据3DAL的实验设置来报告DetZero在5个指定序列上的AP性能,通过比较基于单帧的重标注结果与原始真值标注结果的一致性来衡量人类性能。相对于3DAL和人类,DetZero在不同的性能指标上都表现出了优势

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!对于Vehicle类别在不同IoU阈值下的3D AP和BEV AP性能对比

为了验证高质量的自动标注结果是否能够替代人工标注结果进行在线模型训练,我们在Waymo验证集上进行了半监督学习的验证。我们从训练数据中随机选择了10%作为老师模型(DetZero)的训练数据,并对剩下的90%数据进行推理,得到了自动标注的结果,这些结果将作为学生模型的标签。我们选择了单帧CenterPoint作为学生模型。在车辆类别上,使用90%的自动标签和10%的真值标签进行训练的结果接近于使用100%真值标签训练的结果,而在行人类别上,自动标签训练的模型结果已经优于原始结果,这表明自动标签可以用于在线模型训练

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!在Waymo验证集上进行的半监督实验结果

3.5 可视化结果

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!红色框代表上游的输入结果,蓝色框代表优化模型的输出结果DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!第一行代表上游的输入结果,第二行代表优化模型的输出结果,虚线内的物体表示优化前后差异明显的位置

DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!

原文链接:https://mp.weixin.qq.com/s/HklBecJfMOUCC8gclo-t7Q

以上就是DetZero:Waymo在3D检测榜单上位列第一,与人工标注媲美!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/453232.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 00:16:47
下一篇 2025年11月8日 00:18:47

相关推荐

  • php函数算法优化技巧:从复杂度分析到代码实施

    php 函数算法优化涵盖复杂度分析和代码优化技巧。复杂度评估有助于识别效率瓶颈,包括时间和空间复杂度。代码优化技巧包括:1. 使用数据结构优化;2. 优化循环;3. 避免不必要的函数调用;4. 使用 jit 编译器;5. 启用 opcache。通过应用这些技巧,可以提升 php 函数的效率,进而提高…

    2025年12月10日
    000
  • PHP函数算法优化策略详解

    结论:优化 php 函数算法通过使用合适的数据结构、最小化循环、缓存结果、进行排序、使用并行处理、避免不必要的复制以及利用 php 内置函数,可显著提高应用程序的速度和效率。策略:使用正确的数据结构最小化循环缓存结果使用排序算法使用并行处理避免不必要的复制使用 php 内置函数和扩展 PHP 函数算…

    2025年12月10日
    000
  • js如何实现文本差异对比 4种差异比对算法快速找出文本变化内容

    js实现文本差异对比需遵循以下步骤:1.预处理文本,如清洗字符;2.选择算法如lcs、diff、levenshtein距离或基于单词的对比;3.用js实现所选算法;4.将结果以高亮或报告形式展示。lcs通过动态规划找出最长公共子序列,可优化空间与提前结束运算。diff算法识别插入、删除、替换操作,可…

    2025年12月5日 web前端
    000
  • 无需电池即可实现「自动驾驶」,华盛顿大学开发出无限续航的机器人

    不装电池,也能%ignore_a_1%的“车”出现了。 甚至还会自动收集能量持续运行,完全没有里程焦虑(手动狗头)。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 不错,这么一个小机器人,其实靠的是光和无线电波供能。其名MilliMobil…

    2025年12月2日 科技
    000
  • BEV下的Radar-Camera 融合跨数据集实验研究

    原标题:cross-dataset experimental study of radar-camera fusion in bird’s-eye view论文链接:https://arxiv.org/pdf/2309.15465.pdf作者单位:opel automobile gmbh rhein…

    2025年12月2日 科技
    000
  • 遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

    回归到地面的高度,以实现距离不可知的公式,从而简化仅相机感知方法的优化过程。在路侧camera的3d检测基准上,方法大大超过了以前所有以视觉为中心的方法。它比bevdepth产生了+1.9%的nds和+1.1%的map的显著改善。在nuscenes测试集上,方法取得了实质性的进步,nds和map分别…

    2025年12月2日 科技
    000
  • 改进自动驾驶在不确定环境下的轨迹规划方法

    论文题目:《基于改进的模型预测控制的自动驾驶车辆在不确定环境下的轨迹规划方法》 发表期刊:IEEE Transactions on Intelligent Transportation Systems 发布日期:2023年04月 以下是我自己的論文閱讀筆記,主要是我自己覺得重點的部分,非全文翻譯,該…

    2025年12月2日 科技
    000
  • LeCun对自动驾驶独角兽的造假行为深感失望

    你以为这是一个普通的自动驾驶视频吗? ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片 这个内容需要重新写成中文,而不改变原来的意思 没有一帧是“真的”。 图片 不同路况、各种天气,20多种情况都能模拟,效果以假乱真。 图片 世界模型再次…

    2025年12月2日 科技
    000
  • 实战部署:动态时序网络用于端到端检测和跟踪

    本文经自动驾驶之心公众号授权转载,转载请联系出处。 相信除了少数自研芯片的大厂,绝大多数自动驾驶公司都会使用英伟达NVIDIA芯片,那就离不开TensorRT. TensorRT是在NVIDIA各种GPU硬件平台下运行的一个C++推理框架。我们利用Pytorch、TF或者其他框架训练好的模型,可以首…

    2025年12月2日 科技
    000
  • 利用全景图视觉自注意力模型进行室内框架估计的方法

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 一、研究背景 此方法主要关注室内框架估计(indoor estimation layout estimation)任务,任务输入2D图片,输出图片所描述场景的三维模型。考虑到直接输出三维模型的复…

    2025年12月2日 科技
    000
  • 机器学习算法中的特征筛选问题

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 机器学习算法中的特征筛选问题 在机器学习领域中,特征筛选是一个非常重要的问题,它的目标是从大量的特征中选择出对预测任务最有用的特征。通过特征筛选可以降低维度,减少计算复杂度,提高模型的准确性和解…

    2025年12月1日 科技
    000
  • 自动驾驶中的交通规则识别问题

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 自动驾驶中的交通规则识别问题,需要具体代码示例 摘要:自动驾驶技术正在迅速发展,并且在未来有望实现商业化应用。然而,与此同时,自动驾驶车辆面临着一个重要的挑战,即交通规则的识别和遵守问题。本文将…

    2025年12月1日 科技
    000
  • 自动驾驶与轨迹预测看这一篇就够了!

    轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(cnn&gnn&…

    2025年12月1日 科技
    000
  • 2024年自动驾驶标注行业是否会被世界模型所颠覆?

    1.数据%ignore_a_1%面临的问题(特别是基于BEV 任务) 随着基于BEV transformer 任务的兴起,随之带来的是对数据的依赖变的越来越重,基于BEV 任务的标注也变得越来越重要。目前来看无论是2D-3D的联合障碍物标注,还是基于重建点云的clip 的车道线或者Occpuancy…

    2025年12月1日 科技
    000
  • “真假难辨”!巧用NeRF生成的自动驾驶仿真数据

    写在前面&笔者的个人理解 神经辐射场(NeRF)已成为推进自动驾驶(AD)重新搜索的前奏的工具,提供可扩展的闭环模拟和数据增强功能。然而,为了信任模拟中获得的结果,需要确保AD系统以相同的方式感知真实数据和渲染数据。尽管渲染方法的性能正在提高,但许多场景在忠实重建方面仍然具有固有的挑战性。为…

    2025年12月1日 科技
    000
  • RV融合性能拉爆!RCBEVDet:Radar也有春天,最新SOTA!

    写在前面&笔者的个人理解 这篇讨论文关注的主要问题是3D目标检测技术在自动驾驶进程中的应用。尽管环境视觉相机技术的发展为3D目标检测提供了高分辨率的语义信息,这种方法因无法精确捕获深度信息和在恶劣天气或低光照条件下的表现不佳等问题而受限。针对这一问题,讨论提出了一种结合环视相机和经济型毫米波…

    2025年12月1日 科技
    000
  • 清华朱军团队新作:使用4位整数训练Transformer,比FP16快2.2倍,提速35.1%,加速AGI到来!

    将激活、权重和梯度量化为4位,有望加速神经网络训练。 然而,现有的4位训练方法需要自定义数字格式,而现代硬件不支持这种格式。 最近,清华朱军团队提出了一种使用INT4%ignore_a_1%实现所有矩阵乘法的Transformer训练方法。 使用超低INT4精度进行训练,是非常具有挑战性的。为了实现…

    2025年12月1日 科技
    000
  • 马斯克预测:特斯拉全自动驾驶将在今年实现 对AI深度变化感到担忧

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 他强调特斯拉已经接近实现无人干预的全%ignore_a_1%状态,并指出了全自动驾驶的实用性和提高汽车使用率的重要性。马斯克同时表示特斯拉对于与其他汽车制造商分享和许可自动驾驶技术非常感兴趣。 …

    2025年12月1日 科技
    000
  • Gary Marcus:自动驾驶汽车状况频出,仍未赢得认可

    2016年,《纽约时报》一篇关于%ign%ignore_a_1%re_a_1%汽车的文章开头写道:“自动驾驶汽车时代已经到来,一些汽车制造商已投资数十亿美元进行研发……并在美国的一些城市开始测试。”经过7年的时间,自动驾驶技术取得了哪些进展呢? 纽约大学的心理学和神经科学荣誉教授Gary Marcu…

    2025年12月1日 科技
    000
  • 英国拟出新规,特斯拉或面临自动驾驶汽车禁售

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 据消息称,英国将出台《自动驾驶汽车法案》,特斯拉有可能被禁止在英国销售自动驾驶汽车。此举将给埃隆·马斯克和特斯拉带来重大挫折 英国交通运输部计划明年发布相关法规,规定未经批准的汽车制造商不得将车…

    2025年12月1日 科技
    000

发表回复

登录后才能评论
关注微信