效率狂增16倍！VRSO：纯视觉静态物体3D标注，打通数据闭环！

程序猿 • 2025年11月11日 04:14:37 • 用户投稿 • 阅读 2

标注之殇

静态物体检测（SOD），包括交通信号灯、导向牌和交通锥，大多数算法是数据驱动深度神经网络，需要大量的训练数据。现在的做法通常是对大量的训练样本在 LiDAR 扫描的点云数据上进行手动标注，以修复长尾案例。

手动标注难以捕捉真实场景的变异性和复杂性，通常无法考虑遮挡、不同的光照条件和多样的视角（如图1中的黄色箭头）。整个过程链路长、极其耗时、容易出错、成本颇高（如图2）。所以目前公司都寻求自动标注方案，特别是基于纯视觉，毕竟不是每辆车都有激光雷达。

VRSO+是一种以视觉为主、面向静态对象标注的标注系统，主要利用了SFM、2D物体检测和实例分割结果的信息，整体效果：

标注的平均投影误差仅为2.6像素，约为Waymo标注的四分之一（10.6像素）与人工标注相比，速度提高了约16倍

对于静态物体，VRSO通过实例分割和轮廓提取关键点，解决了从不同视角集成和去重静态对象的挑战，以及由于遮挡问题而导致观察不足的困难，从而提高了标注的准确性。从图1上看，与Waymo Open数据集的手动标注结果相比，VRSO展示了更高的鲁棒性和几何精度。

（都看到这里了，不如大拇指往上滑，点击最上方的卡片关注我，整个操作只会花你 1.328 秒，然后带走未来所有干货，万一有用呢～）

破局之法

VRSO系统主要分为两部分：场景重建和静态对象标注。

重建部分不是重点，就是基于 SFM 算法来恢复图像 pose 和稀疏的 3D 关键点。

静态对象标注算法，配合伪代码，大致流程是（以下会分步骤详细展开）：

采用现成的2D物体检测和分割算法生成候选利用 SFM 模型中的 3D-2D 关键点对应关系来跟踪跨帧的 2D 实例引入重投影一致性来优化静态对象的3D注释参数

1.跟踪关联

step 1：根据 SFM 模型的关键点提取 3D 边界框内的 3D 点。step 2：根据 2D-3D 匹配关系计算每个 3D 点在 2D 地图上的坐标。step 3：基于 2D 地图坐标和实例分割角点确定当前 2D 地图上 3D 点的对应实例。step 4：确定每个 2D 图像的 2D 观察与 3D 边界框之间的对应关系。

2.proposal 生成

对静态物体的 3D 框参数（位置、方向、大小）进行整个视频剪辑的初始化。SFM 的每个关键点都有准确的3D位置和对应的 2D 图像。对于每个 2D 实例，提取 2D 实例掩码内的特征点。然后，一组对应 3D 关键点可以被视为 3D 边界框的候选。

路牌被表示为在空间中具有方向的矩形，它有6个自由度，包括平移（、、）、方向（θ）和大小（宽度和高度）。考虑到其深度，交通信号灯具有7个自由度。交通锥的表示方式与交通信号灯类似。

通义视频

通义万相AI视频生成工具

70 查看详情

3.proposal refine

step 1：从 2D 实例分割中提取每个静态物体的轮廓。step 2：为轮廓轮廓拟合最小定向边界框（OBB）。step 3：提取最小边界框的顶点。step 4：根据顶点和中心点计算方向，并确定顶点顺序。step 5：基于2D检测和实例分割结果进行了分割和合并过程。step 6：检测并拒绝包含遮挡的观察。从2D实例分割蒙版中提取顶点要求每个标牌的四个角都可见。如果有遮挡，从实例分割中提取轴对齐边界框（AABB），并计算AABB与2D检测框之间的面积比。如果没有遮挡，这两种面积计算方法应该是接近的。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

4.三角化

通过三角化在3D条件下获取静态物体的初始顶点值。

通过检查在场景重建期间由 SFM 和实例分割获得的3D边界框中的关键点数量，只有关键点数量超过阈值的实例被认为是稳定且有效的观测。对于这些实例，相应的 2D 边界框被视为有效的观测。通过多幅图像的 2D 观测，将 2D边界框顶点进行三角化，以获取边界框的坐标。

对于没有在掩模上区分“左下、左上、右上、右上和右下”顶点的圆形标牌，需要识别这些圆形标牌。使用 2D 检测结果作为圆形物体的观测结果，使用 2D 实例分割掩模进行轮廓提取。通过最小二乘拟合算法计算出中心点和半径。圆形标牌的参数包括中心点（、、）、方向（θ）和半径（）。

5.tracking refine

跟踪基于 SFM 的特征点匹配。根据 3D 边界框顶点的欧式距离和 2D 边界框投影 IoU 来确定是否合并这些分开的实例。一旦合并完成，实例内的 3D 特征点可以聚集以关联更多的2D特征点。进行迭代2D-3D关联，直到无法添加任何2D特征点为止。

6.最终参数优化

以矩形标牌为例，可优化的参数包括位置（、、）、方向（θ）和大小（、），总共六个自由度。主要步骤包括：

将六个自由度转换为四个 3D 点，并计算旋转矩阵。将转换后的四个 3D 点投影到2D图像上。计算投影结果与实例分割得到的角点结果之间的残差。使用 Huber 进行优化更新边界框参数

标注效果

也有一些具有挑战性的长尾案例，例如极低的分辨率和照明不足。

总结一下

VRSO 框架实现了静态物体高精度和一致的3D标注，紧密集成了检测、分割和 SFM 算法，消除了智能驾驶标注中的人工干预，提供了与基于LiDAR的手动标注相媲美的结果。和被广泛认可的Waymo Open Dataset进行了定性和定量评估：与人工标注相比，速度提高了约16倍，同时保持了最佳的一致性和准确性。

以上就是效率狂增16倍！VRSO：纯视觉静态物体3D标注，打通数据闭环！的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/616429.html

3d 智能驾驶标注

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Spring Boot入门教程1、使用Spring Boot构建第一个Web应用程序

上一篇 2025年11月11日 04:14:36

京东怎么申请七天无理由退货

下一篇 2025年11月11日 04:14:39

利用纯CSS创建 3D 穿梭效果（附代码）

怎么创建3d 穿梭效果？实现一种加速动画效果？下面本篇文章就来给大家介绍一下如何使用纯css来轻松搞定它！希望对大家有所帮助！周末在家习惯性登陆 Apex，准备玩几盘。在登陆加速器的过程中，发现加速器到期了。我一直用的腾讯网游加速器，然而点击充值按钮，提示最近客户端升级改造，暂不支持充值（这个操…

程序猿
2025年12月24日 • 好文分享
1000
纯CSS3实现3d立体文字效果（源码分析）

本篇文章带大家了解一下3d文字效果的实现原理，没有考虑代码的复用性和可移植性，有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。 1.单单纯纯的效果一为了简化操作，我们使用和上一篇文章《纯CSS3文字效果推荐》一样的文档结构，后面的效果大差小不差，也就不再列出。前端开发whqet …

程序猿
2025年12月24日 • 好文分享
0000
纯CSS3实现3D翻转效果的代码示例

本篇文章给大家带来的内容是关于纯CSS3实现3D翻转效果的代码示例，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。作为前端开发人员的必修课，CSS3能带我们完成许多基本动效，本期我们将用CSS3实现hover翻转效果~ 第一步非常简单，我们简单画1个演示方块，为其添加transit…

程序猿
2025年12月24日 • 好文分享
0000
CSS3 3D旋转rotate效果的使用介绍

这篇文章主要为大家详细介绍了css3 3d旋转rotate效果实例，具有一定的参考价值，感兴趣的小伙伴们可以参考一下本文实例为大家分享了CSS3 3D旋转rotate效果实例，供大家参考，具体内容如下效果图：示例代码立即学习“前端免费学习笔记（深入）”； 3D旋转的Demo #experim…

程序猿
2025年12月24日 • 好文分享
0000
好文分享

如何利用CSS3实现3D翻书效果

这篇文章主要介绍了css3实现3d翻书效果，基于css3新属性animation及transform实现类似翻书效果，具有一定的参考价值，感兴趣的小伙伴们可以参考一下先上效果图：（样式有点丑，可以忽略一下下，效果出来了就好，后期加到其他项目中方便更改0.0）类似翻书效果，原本的意思是使用JS来控…

程序猿
2025年12月24日
0000
好文分享

关于css过渡和3D效果的简单实现

下面为大家带来一篇css过渡+3d效果的简单实现。内容挺不错的，现在就分享给大家，也给大家做个参考。 css过渡+3D效果的简单实现 guodu#wp{ border: 1px solid red; width: 500px; height: 500px; background-color: pin…

程序猿
2025年12月24日
0000
用css3简单的制作3d半透明立方体图片详解

new document //css部分html{font-size:62.5%;}img{width:300px;height:300px;} #stage{//搭建一个舞台margin-top:200px;margin-left:auto;margin-right:auto;width:300p…

程序猿
好文分享 2025年12月23日
0000
教你玩转CSS3的3D效果

css3的3d起步要玩转css3的3d，就必须了解几个词汇，便是透视(perspective)、旋转(rotate)和移动(translate)。透视即是以现实的视角来看屏幕上的2d事物，从而展现3d的效果。旋转则不再是2d平面上的旋转，而是三维坐标系的旋转，就包括x轴，y轴，z轴旋转。平移同理。…

程序猿
2025年12月23日 • 好文分享
1000
好文分享

C++框架在智能驾驶领域的应用

c++++框架在智能驾驶领域广泛应用，因为它具有高性能、可靠性和可扩展性。案例包括apollo（百度）、autoware.auto（adl）和carla（epic games）。在开发智能驾驶系统时，应选择合适的框架并遵循以下步骤：1. 选择框架；2. 设计系统架构；3. 编写代码；4. 集成框架功…

程序猿
2025年12月18日
3000
当贝X5S怎样看3D

当贝X5S观看3D影片无立体效果时，需开启3D模式并匹配格式：1. 播放3D影片时按遥控器侧边键，进入快捷设置选择3D模式；2. 根据片源类型选左右或上下3D格式；3. 可通过首页下拉进入电影专区选择3D内容播放；4. 确认片源为Side by Side或Top and Bottom格式，并使用兼容…

程序猿
2025年12月6日 • 用户投稿
1000
华为乾崑智驾已避免300万次可能碰撞安全性能拉满

10月23日，华为正式对外宣布，其乾崑智驾ads系统取得关键进展——累计成功规避潜在碰撞事故超300万次。这一成果充分展现了该系统在智能驾驶安全领域的强大实力，核心支撑正是其搭载的全维防碰撞系统cas 4.0，具备五维立体的安全防护能力。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无…

程序猿
2025年12月6日 • 用户投稿
1000
小米YU9新车渲染图曝光：悬浮式车顶设计+贯穿式尾灯

小编注意到，近期有博主曝光了小米yu9的最新渲染图，并透露该车型将定位于增程式动力的大六座suv。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 从渲染图来看，小米YU9采用了封闭式前脸设计，贯穿式LED灯带与分体式大灯组合营造出强烈的层次…

程序猿
2025年12月6日 • 用户投稿
1000
用户投稿

赛力斯总裁“凡尔赛诉苦”：问界 M9 太智能导致用户投诉

近日，cnmo 注意到，据相关媒体报道，在 2024 年中国电动汽车百人会论坛上，赛力斯汽车总裁何利扬就旗下车型问界 m9 的智能化问题发表了看法。他坦言，由于问界 m9 的智能化程度较高，许多用户在使用过程中遇到了功能操作上的困惑，并因此提出了投诉和反馈。何利扬表示，传统的豪华车型往往配备大量的…

程序猿
2025年12月5日
0000
用户投稿

大众集团公布上海车展参展计划：发布7款全球首发新车

大众汽车集团上海车展盛大亮相：七款全球首秀车型及全新驾驶辅助系统大众汽车集团将在即将开幕的上海车展上带来七款全球首发车型，其中五款将在4月22日的媒体之夜率先登场。本次车展，大众集团还将发布一款专为中国市场研发的先进驾驶辅助系统，由其在华智能驾驶研发合资企业酷睿程打造。 ☞☞☞AI 智能聊天, …

程序猿
2025年12月5日
0000
用户投稿

比亚迪一季度在中国香港超越特斯拉丰田高居第一

中国香港汽车市场正经历着翻天覆地的变化。2025年第一季度香港私家车首次登记品牌排行榜top20显示，比亚迪以2473辆的销量夺冠，力压丰田、特斯拉和本田等国际巨头。业内人士分析，香港作为中国汽车品牌进军国际市场的桥头堡，其市场表现对品牌国际化具有重要意义。比亚迪在香港超越丰田和本田，预示着中国汽车…

程序猿
2025年12月5日
1000
用户投稿

三大新势力新增订单曝光鸿蒙零跑达1.5万小鹏约1.3万

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 9月8日，车fans创始人孙少军公布了三家造车新势力在9月首周（9月1日至9月7日）的新增订单情况。数据显示，市场竞争愈发激烈，多家车企迎来阶段性销量高峰。据孙少军透露，鸿蒙智行（涵盖问界、智…

程序猿
2025年12月5日
0000
用户投稿

受光伏行业周期波动影响，天准科技2024年营收同比下降2.38%

天准科技公告，2024年营业收入为16.09亿元，同比下降2.38%。归属于上市公司股东的净利润为1.25亿元，同比下降42.05%。公司拟以实施权益分派股权登记日登记的总股本扣减公司回购专用证券账户中股份为基数分配利润，向全体股东每10股派发现金红利5元（含税）。从业务板块来看，视觉检测装备产品…

程序猿
2025年12月5日
2000
用户投稿

余承东：全新问界M7 ADS 4挑战重庆复杂道路一把过！

9月8日，余承东在社交平台分享了一段驾驶全新问界m7的实测视频。画面中，他亲自操控车辆，在重庆这座山城挑战十余个高难度道路场景。他在配文中写道：此次来到重庆，驾驶搭载ads 4的全新问界m7，挑战了10多个复杂路况，全程一次性通过！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使…

程序猿
2025年12月5日
0000
用户投稿

小鹏汽车启动720亿参数自驾基模研发初步验证自动驾驶规模法则

小鹏汽车720亿参数自动驾驶大模型震撼发布！小鹏汽车在香港举办的ai技术分享会上，首次公开其正在研发的超大规模自动驾驶大模型——“小鹏世界基座模型”，参数量高达720亿。该模型将通过云端蒸馏技术部署到车端，为小鹏汽车、机器人和飞行汽车等提供强大的ai“大脑”。 ☞☞☞AI 智能聊天, 问答助手, …

程序猿
2025年12月5日
1000
用户投稿

终结“油车不智能”时代！联手奥迪 A5L Sportback首搭华为乾崑智驾

8月1日，上海国际赛车场迎来一场重新定义燃油车智能化进程的重磅发布——全球首款搭载华为乾崑智驾系统的燃油车型，上汽奥迪a5l sportback正式上市。华为乾崑智驾携手上汽奥迪，以“德系机械工艺+中国智能科技”的创新融合，打破“高阶智驾专属新能源”的固有认知。华为智能汽车解决方案 BU 产品营销…

程序猿
2025年12月5日
1000