效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

标注之殇

静态物体检测(SOD),包括交通信号灯、导向牌和交通锥,大多数算法是数据驱动深度神经网络,需要大量的训练数据。现在的做法通常是对大量的训练样本在 LiDAR 扫描的点云数据上进行手动标注,以修复长尾案例。

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

手动标注难以捕捉真实场景的变异性和复杂性,通常无法考虑遮挡、不同的光照条件和多样的视角(如图1中的黄色箭头)。整个过程链路长、极其耗时、容易出错、成本颇高(如图2)。所以目前公司都寻求自动标注方案,特别是基于纯视觉,毕竟不是每辆车都有激光雷达。

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

VRSO+是一种以视觉为主、面向静态对象标注的标注系统,主要利用了SFM、2D物体检测和实例分割结果的信息,整体效果:

标注的平均投影误差仅为2.6像素,约为Waymo标注的四分之一(10.6像素)与人工标注相比,速度提高了约16倍

对于静态物体,VRSO通过实例分割和轮廓提取关键点,解决了从不同视角集成和去重静态对象的挑战,以及由于遮挡问题而导致观察不足的困难,从而提高了标注的准确性。从图1上看,与Waymo Open数据集的手动标注结果相比,VRSO展示了更高的鲁棒性和几何精度。

(都看到这里了,不如大拇指往上滑,点击最上方的卡片关注我,整个操作只会花你 1.328 秒,然后带走未来所有干货,万一有用呢~

破局之法

VRSO系统主要分为两部分:场景重建静态对象标注

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

重建部分不是重点,就是基于 SFM 算法来恢复图像 pose 和稀疏的 3D 关键点。

静态对象标注算法,配合伪代码,大致流程是(以下会分步骤详细展开):

采用现成的2D物体检测和分割算法生成候选利用 SFM 模型中的 3D-2D 关键点对应关系来跟踪跨帧的 2D 实例引入重投影一致性来优化静态对象的3D注释参数

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

1.跟踪关联

step 1:根据 SFM 模型的关键点提取 3D 边界框内的 3D 点。step 2:根据 2D-3D 匹配关系计算每个 3D 点在 2D 地图上的坐标。step 3:基于 2D 地图坐标和实例分割角点确定当前 2D 地图上 3D 点的对应实例。step 4:确定每个 2D 图像的 2D 观察与 3D 边界框之间的对应关系。

2.proposal 生成

对静态物体的 3D 框参数(位置、方向、大小)进行整个视频剪辑的初始化。SFM 的每个关键点都有准确的3D位置和对应的 2D 图像。对于每个 2D 实例,提取 2D 实例掩码内的特征点。然后,一组对应 3D 关键点可以被视为 3D 边界框的候选。

路牌被表示为在空间中具有方向的矩形,它有6个自由度,包括平移(、、)、方向(θ)和大小(宽度和高度)。考虑到其深度,交通信号灯具有7个自由度。交通锥的表示方式与交通信号灯类似。

通义视频 通义视频

通义万相AI视频生成工具

通义视频 70 查看详情 通义视频

3.proposal refine

step 1:从 2D 实例分割中提取每个静态物体的轮廓。step 2:为轮廓轮廓拟合最小定向边界框(OBB)。step 3:提取最小边界框的顶点。step 4:根据顶点和中心点计算方向,并确定顶点顺序。step 5:基于2D检测和实例分割结果进行了分割和合并过程。step 6:检测并拒绝包含遮挡的观察。从2D实例分割蒙版中提取顶点要求每个标牌的四个角都可见。如果有遮挡,从实例分割中提取轴对齐边界框(AABB),并计算AABB与2D检测框之间的面积比。如果没有遮挡,这两种面积计算方法应该是接近的。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

效率狂增16倍!vrso:纯视觉静态物体3d标注,打通数据闭环!

4.三角化

通过三角化在3D条件下获取静态物体的初始顶点值。

通过检查在场景重建期间由 SFM 和实例分割获得的3D边界框中的关键点数量,只有关键点数量超过阈值的实例被认为是稳定且有效的观测。对于这些实例,相应的 2D 边界框被视为有效的观测。通过多幅图像的 2D 观测,将 2D边界框顶点进行三角化,以获取边界框的坐标。

对于没有在掩模上区分“左下、左上、右上、右上和右下”顶点的圆形标牌,需要识别这些圆形标牌。使用 2D 检测结果作为圆形物体的观测结果,使用 2D 实例分割掩模进行轮廓提取。通过最小二乘拟合算法计算出中心点和半径。圆形标牌的参数包括中心点(、、)、方向(θ)和半径()。

5.tracking refine

跟踪基于 SFM 的特征点匹配。根据 3D 边界框顶点的欧式距离和 2D 边界框投影 IoU 来确定是否合并这些分开的实例。一旦合并完成,实例内的 3D 特征点可以聚集以关联更多的2D特征点。进行迭代2D-3D关联,直到无法添加任何2D特征点为止。

6.最终参数优化

以矩形标牌为例,可优化的参数包括位置(、、)、方向(θ)和大小(、),总共六个自由度。主要步骤包括:

将六个自由度转换为四个 3D 点,并计算旋转矩阵。将转换后的四个 3D 点投影到2D图像上。计算投影结果与实例分割得到的角点结果之间的残差。使用 Huber 进行优化更新边界框参数

标注效果

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

也有一些具有挑战性的长尾案例,例如极低的分辨率和照明不足。

效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!

总结一下

VRSO 框架实现了静态物体高精度和一致的3D标注,紧密集成了检测、分割和 SFM 算法,消除了智能驾驶标注中的人工干预,提供了与基于LiDAR的手动标注相媲美的结果。和被广泛认可的Waymo Open Dataset进行了定性和定量评估:与人工标注相比,速度提高了约16倍,同时保持了最佳的一致性和准确性。

以上就是效率狂增16倍!VRSO:纯视觉静态物体3D标注,打通数据闭环!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/616429.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 04:13:48
下一篇 2025年11月11日 04:18:19

相关推荐

  • 当贝X5S怎样看3D

    当贝X5S观看3D影片无立体效果时,需开启3D模式并匹配格式:1. 播放3D影片时按遥控器侧边键,进入快捷设置选择3D模式;2. 根据片源类型选左右或上下3D格式;3. 可通过首页下拉进入电影专区选择3D内容播放;4. 确认片源为Side by Side或Top and Bottom格式,并使用兼容…

    2025年12月6日 软件教程
    100
  • 华为乾崑智驾已避免300万次可能碰撞 安全性能拉满

    10月23日,华为正式对外宣布,其乾崑智驾ads系统取得关键进展——累计成功规避潜在碰撞事故超300万次。这一成果充分展现了该系统在智能驾驶安全领域的强大实力,核心支撑正是其搭载的全维防碰撞系统cas 4.0,具备五维立体的安全防护能力。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无…

    2025年12月6日 科技
    000
  • 小米YU9新车渲染图曝光:悬浮式车顶设计+贯穿式尾灯

    小编注意到,近期有博主曝光了小米yu9的最新渲染图,并透露该车型将定位于增程式动力的大六座suv。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 从渲染图来看,小米YU9采用了封闭式前脸设计,贯穿式LED灯带与分体式大灯组合营造出强烈的层次…

    2025年12月6日 科技
    000
  • 赛力斯总裁“凡尔赛诉苦”:问界 M9 太智能导致用户投诉

    近日,cnmo 注意到,据相关媒体报道,在 2024 年中国电动汽车百人会论坛上,赛力斯汽车总裁何利扬就旗下车型问界 m9 的智能化问题发表了看法。他坦言,由于问界 m9 的智能化程度较高,许多用户在使用过程中遇到了功能操作上的困惑,并因此提出了投诉和反馈。 何利扬表示,传统的豪华车型往往配备大量的…

    2025年12月5日
    000
  • 大众集团公布上海车展参展计划:发布7款全球首发新车

    大众汽车集团上海车展盛大亮相:七款全球首秀车型及全新驾驶辅助系统 大众汽车集团将在即将开幕的上海车展上带来七款全球首发车型,其中五款将在4月22日的媒体之夜率先登场。 本次车展,大众集团还将发布一款专为中国市场研发的先进驾驶辅助系统,由其在华智能驾驶研发合资企业酷睿程打造。 ☞☞☞AI 智能聊天, …

    2025年12月5日
    000
  • 比亚迪一季度在中国香港超越特斯拉丰田 高居第一

    中国香港汽车市场正经历着翻天覆地的变化。2025年第一季度香港私家车首次登记品牌排行榜top20显示,比亚迪以2473辆的销量夺冠,力压丰田、特斯拉和本田等国际巨头。业内人士分析,香港作为中国汽车品牌进军国际市场的桥头堡,其市场表现对品牌国际化具有重要意义。比亚迪在香港超越丰田和本田,预示着中国汽车…

    2025年12月5日
    100
  • 三大新势力新增订单曝光 鸿蒙零跑达1.5万 小鹏约1.3万

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 9月8日,车fans创始人孙少军公布了三家造车新势力在9月首周(9月1日至9月7日)的新增订单情况。数据显示,市场竞争愈发激烈,多家车企迎来阶段性销量高峰。 据孙少军透露,鸿蒙智行(涵盖问界、智…

    2025年12月5日
    000
  • 受光伏行业周期波动影响,天准科技2024年营收同比下降2.38%

    天准科技公告,2024年营业收入为16.09亿元,同比下降2.38%。归属于上市公司股东的净利润为1.25亿元,同比下降42.05%。公司拟以实施权益分派股权登记日登记的总股本扣减公司回购专用证券账户中股份为基数分配利润,向全体股东每10股派发现金红利5元(含税)。 从业务板块来看,视觉检测装备产品…

    2025年12月5日
    000
  • 余承东:全新问界M7 ADS 4挑战重庆复杂道路 一把过!

    9月8日,余承东在社交平台分享了一段驾驶全新问界m7的实测视频。画面中,他亲自操控车辆,在重庆这座山城挑战十余个高难度道路场景。他在配文中写道:此次来到重庆,驾驶搭载ads 4的全新问界m7,挑战了10多个复杂路况,全程一次性通过! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使…

    2025年12月5日
    000
  • 小鹏汽车启动720亿参数自驾基模研发 初步验证自动驾驶规模法则

    小鹏汽车720亿参数自动驾驶大模型震撼发布! 小鹏汽车在香港举办的ai技术分享会上,首次公开其正在研发的超大规模自动驾驶大模型——“小鹏世界基座模型”,参数量高达720亿。该模型将通过云端蒸馏技术部署到车端,为小鹏汽车、机器人和飞行汽车等提供强大的ai“大脑”。 ☞☞☞AI 智能聊天, 问答助手, …

    2025年12月5日
    000
  • 终结“油车不智能”时代!联手奥迪 A5L Sportback首搭华为乾崑智驾

    8月1日,上海国际赛车场迎来一场重新定义燃油车智能化进程的重磅发布——全球首款搭载华为乾崑智驾系统的燃油车型,上汽奥迪a5l sportback正式上市。 华为乾崑智驾携手上汽奥迪,以“德系机械工艺+中国智能科技”的创新融合,打破“高阶智驾专属新能源”的固有认知。华为智能汽车解决方案 BU 产品营销…

    2025年12月5日
    100
  • 小米电池及车身一体化专利获授权 可提高电池包强度

    天眼查知识产权信息显示,近日,小米汽车科技有限公司申请的“电池及车身一体化结构、车辆”专利已获批准。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 小米汽车底盘 根据专利摘要,该电池及车身一体化结构由车身和动力电池包组成。车身设有两个门槛梁…

    2025年12月4日
    000
  • 小鹏辟谣智驾将重回有图方案:刚分享完基座模型大路线

    4月15日,有报道称小鹏为了与理想竞争,计划在%ign%ignore_a_1%re_a_1%技术上重新考虑众源建图方案。对此,小鹏官方进行了澄清。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 此前有传言称,小鹏内部已经启动了众源建图技术的…

    2025年12月4日
    000
  • 仪式感满满!享界S9增程版豪华配置解析

    人们常说:既然你能买得起豪华轿车品牌,为何还那么在意价格?实际上,即便购买豪华轿车品牌的消费者同样会关注性价比。过去,传统豪华燃油品牌占据主导地位,想要享受豪华配置和舒适体验,往往需要支付更高的费用;但现在,中国的豪华轿车品牌已经打破了这一常规,即使是入门级车型,也能提供尊贵的体验,而刚刚上市的享界…

    2025年12月4日 科技
    000
  • 恶意抹黑无用!李想:理想i8同价位产品力没有对手 处于敌无我有的赛道

    8月15日,%ign%ignore_a_1%re_a_1%董事长、创始人兼CEO李想在社交平台发布长文,全面解读理想i8广受市场欢迎的根本原因,并深入揭示了理想汽车产品战略背后的逻辑框架。 他指出,理想i8之所以能够迅速赢得用户青睐,核心在于其处于“有无之争”的竞争层级。在当前市场中,该车型所具备的…

    2025年12月4日
    000
  • 传祺向往M8乾崑系列发布 配备华为座舱+ADS高阶智驾

    4月16日,广汽传祺正式推出其顶级豪华mpv——传祺向往m8乾崑系列,以融合东方美学和%ignore_a_1%的设计理念,展现中国高端制造的新标杆。这款新车不仅搭载了华为乾崑ads高级智能驾驶系统,还配备了鸿蒙智能座舱系统,成为华系mpv中的智能与豪华的代表作。 ☞☞☞AI 智能聊天, 问答助手, …

    2025年12月4日 科技
    000
  • 领克10 EM-P上市 标配双电机四驱系统 16.38万元起售

    9月8日,领克汽车正式推出全新中大型新能源轿车——领克10 em-p。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 领克10 EM-P搭载1.5T Evo混动专用发动机,热效率高达47.26%,为当前行业最高水平。配合P1+P3+P4三电…

    2025年12月4日
    100
  • 岚图泰山渲染图曝光!定位大六座SUV 比库里南霸气?

    近日,一位汽车设计博主根据官方发布的轻伪装夏季测试视频,制作出一组非官方的岚图泰山渲染图。从图片来看,新车延续了岚图家族的设计风格,前脸采用标志性的金属直瀑式格栅设计。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 岚图泰山非官方渲染图(下…

    2025年12月4日
    000
  • 鸿蒙智行第五界正式登场!时尚精品的尚界凭何成为年轻人首选?

    【小编科技】2025年4月16日,备受期待的“第五界”尚界在鸿蒙智行的新品发布会上正式亮相。作为华为与上汽共同打造的全新品牌,尚界无疑是携带优越资源诞生的新星。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 华为通过前“四界”的成功经验,已…

    2025年12月3日 科技
    000
  • 智界品牌之夜发布会汇总,智界 R7/S7 四款新车齐发

    中关村在线报道:4月17日晚,鸿蒙智行品牌之夜发布会隆重举行。在发布会上,智界 r7 增程版和智界新 s7 ultra 运动版正式亮相。 价格一览: 智界 R7 增程 Max 版:29.98 万元 智界 R7 增程 Ultra 版:31.98 万元 智界新 S7 Ultra 100 度大电池版:31…

    2025年12月3日 硬件教程
    000

发表回复

登录后才能评论
关注微信