云上智能驾驶三维重建优秀实践

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

云上智能驾驶三维重建优秀实践

智能驾驶技术的不断发展,正在改变着我们的出行方式和交通系统。作为其中的一个关键技术,三维重建在智能驾驶系统中起着重要的作用。除去车端本身的感知、重建算法,自动驾驶技术的落地与发展需要庞大的云端重建能力支撑,火山引擎多媒体实验室通过行业领先的自研三维重建技术,结合强大的云平台资源与能力,助力相关技术在云端大规模重建、自动标注、真实感仿真等场景的落地与应用。

本文重点介绍火山引擎多媒体实验室三维重建技术在动态、静态场景的以及结合先进光场重建技术的原理与实践,帮助大家能更好的了解和认识云上智能三维重建如何服务智能驾驶领域,助力行业发展。

一、技术挑战与难点

驾驶场景重建需要对道路环境做点云级别的三维重建,与传统的三维重建技术应用场景相比,驾驶场景重建技术有以下难点:

车辆运行过程中的环境因素复杂且不可控,不同天气、光照、车速、路况等均会对车载传感器采集到的数据造成影响,这对重建技术的鲁棒性带来了挑战。道路场景中经常会出现特征退化和纹理缺失的情况,例如相机获取到视觉特征不丰富的图像信息,或者激光雷达获取到相似性较高的场景结构信息,同时,路面作为重建中的关键要素之一,色彩单一且缺少足够的纹理信息,这对重建技术提出了更高的要求。车载传感器数量较多,常见的有相机、激光雷达、毫米波雷达、惯导、GPS定位系统、轮速计等等,如何将多传感器的数据融合起来得到更精确的重建结果,对重建技术提出了挑战。道路中存在运动车辆、非机动车、行人等动态物体,会对传统重建算法带来挑战,如何剔除动态物体对静态场景重建带来干扰,同时对动态物体的位置、大小、速度进行估计,也是项目的难点之一。

二、驾驶场景重建技术介绍

自动驾驶领域的重建算法通常会采用激光雷达、相机为主,GPS、惯导为辅的技术路线。激光雷达可以直接获取高精度的测距信息,能够快速得到场景结构,通过预先进行的激光雷达-相机联合标定,相机获取到的图像能够为激光点云赋予色彩、语义等信息。同时,GPS和惯导可以进行辅助定位,减少重建过程中因为特征退化而出现的漂移现象。但是,由于多线激光雷达售价较高,通常用于工程车辆,而在量产车上很难得到规模化的使用。

对此,火山引擎多媒体实验室自研了一套纯视觉的驾驶场景重建技术,包括静态场景重建、动态物体重建和神经辐射场重建技术,能够区分场景中的动静态物体,还原出静态场景的稠密点云,并突出路面、指示牌、红绿灯等关键要素;能够对场景中运动物体的位置、大小、朝向和速度进行有效的估计,用于后续的4D标注;能够在静态场景重建的基础上,使用神经辐射场对场景进行重建和复现,实现自由视角的漫游,可用于场景编辑和仿真渲染。这套技术解决方案不依赖激光雷达,且能够达到分米级的相对误差,用最小的硬件成本实现接近激光雷达的重建效果。

2.1 静态场景重建技术:剔除动态干扰、还原静态场景

视觉重建技术以多视角几何作为基础的理论依据,要求待重建的场景或者物体具有帧间一致性,即在不同图像帧中处在静止状态,因此需要在重建过程中剔除动态物体。根据场景中的不同要素的重要性,稠密点云中需要去除无关紧要的点云,而保留一些关键要素点云,因此需要事先对图像进行语义分割。对此, 火山引擎 多媒体实验室结合AI技术与多视角几何基本原理,搭建了一套先进的鲁棒、精确完整视觉重建算法框架。重建过程包括三个关键步骤 :图像预处理、稀疏重建和稠密重建 

云上智能驾驶三维重建优秀实践

车载相机拍摄过程中处在运动状态,由于曝光时间的存在,采集到的图像中会随着车速提高而出现严重的运动模糊现象。另外,出于节约带宽和存储空间考虑,传输过程中会对图像进行不可逆的有损压缩,造成画质的进一步降低。为此, 火山引擎多媒体实验室使用了端到端的神经网络对图像进行去模糊处理,能够在抑制运动模糊现象的同时对图像质量进行提升。去模糊前后的对比如下图所示。

云上智能驾驶三维重建优秀实践

去模糊前(左) 去模糊后(右)

为了区分出动态物体,火山引擎多媒体实验室使用了基于光流的动态物体识别技术,能够得到像素级别的动态物体掩膜。在之后的静态场景重建过程中,落在动态物区域上的特征点将被剔除,只有静态的场景和物体将得到保留。

云上智能驾驶三维重建优秀实践

光流(左) 运动物体(右)

稀疏重建过程中需要同时计算相机的位置、朝向和场景点云,常用的有SLAM算法(Simultaneous localization and mapping)和SFM算法(Structure from Motion,简称SfM)。在不要求实时性的情况下,SFM算法能够得到更高的重建精度。但是,传统的SFM算法通常将每个相机当作独立相机来进行处理,而车辆上通常会在前后左右不同方向布置多个相机,这些相机之间的相对位置其实是固定不变的(忽略车辆振动带来的细微变化)。如果忽视相机与相机之间的相对位置约束,计算出来的各相机位姿误差会比较大。另外,当遮挡比较严重时,个别相机的位姿会难以计算。对此,火山引擎多媒体实验室自研了基于相机组整体的SFM算法,能够利用相机之间的先验相对位姿约束,以相机组作为整体来计算位姿,同时使用了GPS加惯导的融合定位结果对相机组中心位置进行约束,可有效地提高位姿估计的成功率和准确率,并能改善不同相机之间的点云不一致现象,减少点云分层现象。

降重鸟 降重鸟

要想效果好,就用降重鸟。AI改写智能降低AIGC率和重复率。

降重鸟 113 查看详情 降重鸟

云上智能驾驶三维重建优秀实践

云上智能驾驶三维重建优秀实践

传统SFM(左) 相机组SFM(右)

由于地面色彩单一、纹理缺失,传统的视觉重建很难还原出完整的地面,但是地面上存在车道线、箭头、文字/标识等关键要素,因此火山引擎多媒体实验室采用了二次曲面来拟合地面,辅助进行地面区域的深度估计和点云融合。和平面拟合相比,二次曲面更贴合实际道路场景,因为实际的路面往往并不是一个理想平面。以下是分别用平面方程和二次曲面方程来拟合地面的效果对比。

云上智能驾驶三维重建优秀实践

平面方程(左) 二次曲面方程(右)

将激光点云视作真值,并将视觉重建结果与之叠加,可以直观地衡量重建点云的准确性。从下图中可以看到,重建点云和真值点云贴合度非常高,经过测量得到重建结果的相对误差在15cm左右。

云上智能驾驶三维重建优秀实践

火山引擎多媒体实验室重建结果(彩色)与真值点云(白色)

以下是火山引擎多媒体实验室视觉重建算法和某主流商业重建软件的效果对比。可以看到,和商业软件相比,火山引擎多媒体实验室的自研算法重建效果更好、更完整,场景中的路牌、红绿灯、电线杆,以及路面上车道线、箭头等还原度非常高,而商业软件的重建点云非常稀疏,且路面大范围缺失。

云上智能驾驶三维重建优秀实践

某主流商业软件(左) 火山引擎多媒体实验室算法(右)

2.2 动态重建技术:

在图像上对物体进行3d标注十分困难,需要借助于点云,当车辆只有视觉传感器时,获取场景中目标物体的完整点云十分困难。特别是动态物体,无法使用传统的三维重建技术获取其稠密点云。为提供运动物体的表达,服务于4d标注,使用3d bounding box(以下简称3d bbox)对动态物体进行表示,通过自研动态重建算法获取每一时刻场景中动态物体的3d bbox姿态、大小、速度等,从而补全动态物体重建能力。

云上智能驾驶三维重建优秀实践

动态重建pipeline

对车辆采集的每一帧图像,首先提取场景中的动态目标,生成3d bbox的初始提议,提供两种方式:使用2d目标检测,通过相机位姿估计对应的3d bbox;直接使用3d目标检测。两种方式针对不同数据可以灵活进行选择,2d检测泛化性好,3d检测可以获得更好的初值。同时,对图像动态区域内部的特征点进行提取。获取单帧图像初始3d bbox提议及特征点后,建立多帧间数据关联:通过自研多目标跟踪算法建立物体匹配,并通过特征匹配技术对图像特征进行匹配。获取匹配关系后,将有共视关系的图像帧创建为局部地图,构建优化问题求解全局一致的目标bbox估计。具体地,通过特征点的匹配以及动态三角化技术,恢复动态3d点;对车辆运动建模,联合优化物体、3d点、相机之间的观测,从而获得最优估计的动态物体3d bbox。

云上智能驾驶三维重建优秀实践

2d生成3d(左二) 3d目标检测示例

2.3 NeRF 重建:真实感渲染、自由视角

使用神经网络进行隐式重建,利用可微渲染模型,从已有视图中学习如何渲染新视角下的图像,从而实现照片级逼真的图像渲染, 即神经辐射场(NeRF)技术。同时,隐式重建具有可编辑、查询连续空间的特性,可以用于自动驾驶场景中自动标注、仿真数据构建等任务。使用NeRF技术对场景进行重建是非常有价值的。

云上智能驾驶三维重建优秀实践

火山引擎多媒体实验室融合神经辐射场技术与大场景建模技术。在具体实践中,首先针对数据进行处理,场景中的动态物体会使NeRF重建出现伪影,借助自研动静态分割、影子检测等算法,对场景中和几何不一致的区域进行提取,生成mask,同时利用视频inpainting算法,对剔除掉的区域进行修复。借助自研三维重建能力,对场景进行高精度的几何重建,包括相机参数估计以及稀疏、稠密点云生成。另外,对场景进行拆分以减小单次训练资源消耗,并可做分布式训练、维护。在神经辐射场训练过程中,针对室外无边界大场景,团队通过一些优化策略以提升该场景下的新视角生成效果,如通过在训练中同时优化位姿提高重建精度,基于哈希编码的层次化表达提升模型训练速度,借助外观编码提升不同时间采集场景的外观一致性等,借助mvs稠密深度信息提升几何精度等。团队同毫末智行合作,完成单路采集以及多路合并的NeRF重建,相关成果已在毫末AI Day发布。

云上智能驾驶三维重建优秀实践

动态物/影子剔除,填补

以上就是云上智能驾驶三维重建优秀实践的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/474289.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 08:48:04
下一篇 2025年11月8日 08:48:46

相关推荐

  • 华为乾崑智驾已避免300万次可能碰撞 安全性能拉满

    10月23日,华为正式对外宣布,其乾崑智驾ads系统取得关键进展——累计成功规避潜在碰撞事故超300万次。这一成果充分展现了该系统在智能驾驶安全领域的强大实力,核心支撑正是其搭载的全维防碰撞系统cas 4.0,具备五维立体的安全防护能力。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无…

    2025年12月6日 科技
    000
  • AI推文助手如何制作行业白皮书 AI推文助手的专业报告生成

    首先明确白皮书主题与受众,确定行业领域及读者特征,并输入关键词引导AI生成;接着构建包含执行摘要、市场背景等模块的结构化框架,合理分配字数比例并分段指令生成;随后提供权威数据来源与可视化提示,增强内容可信度;再通过设定语言风格与专业术语表,提升文本专业性;最后采用分章节生成与人工校验相结合的方式,确…

    2025年12月6日 科技
    000
  • 小米YU9新车渲染图曝光:悬浮式车顶设计+贯穿式尾灯

    小编注意到,近期有博主曝光了小米yu9的最新渲染图,并透露该车型将定位于增程式动力的大六座suv。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 从渲染图来看,小米YU9采用了封闭式前脸设计,贯穿式LED灯带与分体式大灯组合营造出强烈的层次…

    2025年12月6日 科技
    000
  • 赛力斯总裁“凡尔赛诉苦”:问界 M9 太智能导致用户投诉

    近日,cnmo 注意到,据相关媒体报道,在 2024 年中国电动汽车百人会论坛上,赛力斯汽车总裁何利扬就旗下车型问界 m9 的智能化问题发表了看法。他坦言,由于问界 m9 的智能化程度较高,许多用户在使用过程中遇到了功能操作上的困惑,并因此提出了投诉和反馈。 何利扬表示,传统的豪华车型往往配备大量的…

    2025年12月5日
    000
  • 什么是数据银行?天猫数据银行如何开通?揭秘天猫数据银行开通全流程!

    在数字经济迅猛发展的当下,数据银行正成为企业实现精准营销的关键利器。作为阿里巴巴生态中的核心大数据平台,天猫数据银行通过整合全域消费者行为数据,助力品牌打造精细化用户画像,推动从流量思维向人群运营的全面升级。本文将深度剖析数据银行的核心价值,并详细指导你如何一步步开通天猫数据银行。 一、什么是数据银…

    2025年12月5日
    000
  • 大众集团公布上海车展参展计划:发布7款全球首发新车

    大众汽车集团上海车展盛大亮相:七款全球首秀车型及全新驾驶辅助系统 大众汽车集团将在即将开幕的上海车展上带来七款全球首发车型,其中五款将在4月22日的媒体之夜率先登场。 本次车展,大众集团还将发布一款专为中国市场研发的先进驾驶辅助系统,由其在华智能驾驶研发合资企业酷睿程打造。 ☞☞☞AI 智能聊天, …

    2025年12月5日
    000
  • 比亚迪一季度在中国香港超越特斯拉丰田 高居第一

    中国香港汽车市场正经历着翻天覆地的变化。2025年第一季度香港私家车首次登记品牌排行榜top20显示,比亚迪以2473辆的销量夺冠,力压丰田、特斯拉和本田等国际巨头。业内人士分析,香港作为中国汽车品牌进军国际市场的桥头堡,其市场表现对品牌国际化具有重要意义。比亚迪在香港超越丰田和本田,预示着中国汽车…

    2025年12月5日
    100
  • 三大新势力新增订单曝光 鸿蒙零跑达1.5万 小鹏约1.3万

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 9月8日,车fans创始人孙少军公布了三家造车新势力在9月首周(9月1日至9月7日)的新增订单情况。数据显示,市场竞争愈发激烈,多家车企迎来阶段性销量高峰。 据孙少军透露,鸿蒙智行(涵盖问界、智…

    2025年12月5日
    000
  • 受光伏行业周期波动影响,天准科技2024年营收同比下降2.38%

    天准科技公告,2024年营业收入为16.09亿元,同比下降2.38%。归属于上市公司股东的净利润为1.25亿元,同比下降42.05%。公司拟以实施权益分派股权登记日登记的总股本扣减公司回购专用证券账户中股份为基数分配利润,向全体股东每10股派发现金红利5元(含税)。 从业务板块来看,视觉检测装备产品…

    2025年12月5日
    000
  • 余承东:全新问界M7 ADS 4挑战重庆复杂道路 一把过!

    9月8日,余承东在社交平台分享了一段驾驶全新问界m7的实测视频。画面中,他亲自操控车辆,在重庆这座山城挑战十余个高难度道路场景。他在配文中写道:此次来到重庆,驾驶搭载ads 4的全新问界m7,挑战了10多个复杂路况,全程一次性通过! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使…

    2025年12月5日
    000
  • 小鹏汽车启动720亿参数自驾基模研发 初步验证自动驾驶规模法则

    小鹏汽车720亿参数自动驾驶大模型震撼发布! 小鹏汽车在香港举办的ai技术分享会上,首次公开其正在研发的超大规模自动驾驶大模型——“小鹏世界基座模型”,参数量高达720亿。该模型将通过云端蒸馏技术部署到车端,为小鹏汽车、机器人和飞行汽车等提供强大的ai“大脑”。 ☞☞☞AI 智能聊天, 问答助手, …

    2025年12月5日
    000
  • 终结“油车不智能”时代!联手奥迪 A5L Sportback首搭华为乾崑智驾

    8月1日,上海国际赛车场迎来一场重新定义燃油车智能化进程的重磅发布——全球首款搭载华为乾崑智驾系统的燃油车型,上汽奥迪a5l sportback正式上市。 华为乾崑智驾携手上汽奥迪,以“德系机械工艺+中国智能科技”的创新融合,打破“高阶智驾专属新能源”的固有认知。华为智能汽车解决方案 BU 产品营销…

    2025年12月5日
    100
  • 小米电池及车身一体化专利获授权 可提高电池包强度

    天眼查知识产权信息显示,近日,小米汽车科技有限公司申请的“电池及车身一体化结构、车辆”专利已获批准。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 小米汽车底盘 根据专利摘要,该电池及车身一体化结构由车身和动力电池包组成。车身设有两个门槛梁…

    2025年12月4日
    000
  • 小鹏辟谣智驾将重回有图方案:刚分享完基座模型大路线

    4月15日,有报道称小鹏为了与理想竞争,计划在%ign%ignore_a_1%re_a_1%技术上重新考虑众源建图方案。对此,小鹏官方进行了澄清。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 此前有传言称,小鹏内部已经启动了众源建图技术的…

    2025年12月4日
    000
  • 仪式感满满!享界S9增程版豪华配置解析

    人们常说:既然你能买得起豪华轿车品牌,为何还那么在意价格?实际上,即便购买豪华轿车品牌的消费者同样会关注性价比。过去,传统豪华燃油品牌占据主导地位,想要享受豪华配置和舒适体验,往往需要支付更高的费用;但现在,中国的豪华轿车品牌已经打破了这一常规,即使是入门级车型,也能提供尊贵的体验,而刚刚上市的享界…

    2025年12月4日 科技
    000
  • 恶意抹黑无用!李想:理想i8同价位产品力没有对手 处于敌无我有的赛道

    8月15日,%ign%ignore_a_1%re_a_1%董事长、创始人兼CEO李想在社交平台发布长文,全面解读理想i8广受市场欢迎的根本原因,并深入揭示了理想汽车产品战略背后的逻辑框架。 他指出,理想i8之所以能够迅速赢得用户青睐,核心在于其处于“有无之争”的竞争层级。在当前市场中,该车型所具备的…

    2025年12月4日
    000
  • 传祺向往M8乾崑系列发布 配备华为座舱+ADS高阶智驾

    4月16日,广汽传祺正式推出其顶级豪华mpv——传祺向往m8乾崑系列,以融合东方美学和%ignore_a_1%的设计理念,展现中国高端制造的新标杆。这款新车不仅搭载了华为乾崑ads高级智能驾驶系统,还配备了鸿蒙智能座舱系统,成为华系mpv中的智能与豪华的代表作。 ☞☞☞AI 智能聊天, 问答助手, …

    2025年12月4日 科技
    000
  • 领克10 EM-P上市 标配双电机四驱系统 16.38万元起售

    9月8日,领克汽车正式推出全新中大型新能源轿车——领克10 em-p。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 领克10 EM-P搭载1.5T Evo混动专用发动机,热效率高达47.26%,为当前行业最高水平。配合P1+P3+P4三电…

    2025年12月4日
    100
  • 岚图泰山渲染图曝光!定位大六座SUV 比库里南霸气?

    近日,一位汽车设计博主根据官方发布的轻伪装夏季测试视频,制作出一组非官方的岚图泰山渲染图。从图片来看,新车延续了岚图家族的设计风格,前脸采用标志性的金属直瀑式格栅设计。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 岚图泰山非官方渲染图(下…

    2025年12月4日
    000
  • 鸿蒙智行第五界正式登场!时尚精品的尚界凭何成为年轻人首选?

    【小编科技】2025年4月16日,备受期待的“第五界”尚界在鸿蒙智行的新品发布会上正式亮相。作为华为与上汽共同打造的全新品牌,尚界无疑是携带优越资源诞生的新星。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 华为通过前“四界”的成功经验,已…

    2025年12月3日 科技
    000

发表回复

登录后才能评论
关注微信