深度估计SOTA!自动驾驶单目与环视深度的自适应融合

写在前面&个人理解

多视图深度估计在各种基准测试中都取得了较高性能。然而,目前几乎所有的多视图系统都依赖于给定的理想相机姿态,而这在许多现实世界的场景中是不可用的,例如自动驾驶。本工作提出了一种新的鲁棒性基准来评估各种噪声姿态设置下的深度估计系统。令人惊讶的是,发现当前的多视图深度估计方法或单视图和多视图融合方法在给定有噪声的姿态设置时会失败。为了应对这一挑战,这里提出了一种单视图和多视图融合的深度估计系统afnet,该系统自适应地集成了高置信度的多视图和单视图结果,以实现稳健和准确的深度估计。自适应融合模块通过基于包裹置信度图在两个分支之间动态选择高置信度区域来执行融合。因此,当面对无纹理场景、不准确的校准、动态对象和其他退化或具有挑战性的条件时,系统倾向于选择更可靠的分支。在稳健性测试下,方法优于最先进的多视图和融合方法。此外,在具有挑战性的基准测试中实现了最先进的性能 (kitti和ddad)。

论文链接:https://arxiv.org/pdf/2403.07535.pdf

论文名称:Adaptive Fusion of Single-View and Multi-View Depth for Autonomous Driving

领域背景

图像深度估计一直是计算机视觉领域的一个挑战,具有广泛的应用。对于基于视觉的自动驾驶系统,深度感知是关键,它有助于理解道路上的物体并构建3D环境地图。随着深度神经网络在各种视觉问题中的应用,基于卷积神经网络(CNN)的方法已经成为深度估计任务的主流。

根据输入格式,主要分为多视角深度估计和单视角深度估计。多视图方法估计深度的假设是,给定正确的深度、相机标定和相机姿态,各个视图的像素应该相似。他们依靠极线几何来三角测量高质量的深度。然而,多视图方法的准确性和鲁棒性在很大程度上取决于相机的几何配置和视图之间的对应匹配。首先,摄像机需要进行足够的平移以进行三角测量。在自动驾驶场景中,自车可能会在红绿灯处停车或在不向前移动的情况下转弯,这会导致三角测量失败。此外,多视图方法存在动态目标和无纹理区域的问题,这些问题在自动驾驶场景中普遍存在。另一个问题是运动车辆上的SLAM姿态优化。在现有的SLAM方法中,噪声是不可避免的,更不用说具有挑战性和不可避免的情况了。例如,一个机器人或自动驾驶汽车可以在不重新校准的情况下部署数年,从而导致姿势嘈杂。相比之下,由于单视图方法依赖于对场景的语义理解和透视投影线索,因此它们对无纹理区域、动态对象更具鲁棒性,而不依赖于相机姿势。然而,由于尺度的模糊性,其性能与多视图方法相比仍有很大差距。在这里,我们倾向于考虑是否可以很好地结合这两种方法的优势,在自动驾驶场景中进行稳健和准确的单目视频深度估计。

AFNet网络结构

AFNet结构如下所示,它由三个部分组成:单视图分支、多视图分支和自适应融合(AF)模块。两个分支共享特征提取网络,并具有自己的预测和置信度图,即、,和,然后由AF模块进行融合,以获得最终准确和稳健的预测,AF模块中的绿色背景表示单视图分支和多视图分支的输出。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

损失函数:

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

单视图和多视图深度模块

为了合并主干特征并获得深度特征Ds,AFNet构建了一个多尺度解码器。在这个过程中,对Ds的前256个通道进行softmax操作,得到深度概率体积Ps。而深度特征中的最后一个通道则被用作单视图深度的置信图Ms。最后,通过软加权的方式来计算单视图深度。

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

多视图分支

多视图分支与单视图分支共享主干,以提取参考图像和源图像的特征。我们采用去卷积将低分辨率特征去卷积为四分之一分辨率,并将它们与用于构建cost volume的初始四分之一特征相结合。通过将源特征wrap到参考相机跟随的假设平面中,形成特征volume。用于不需要太多的鲁棒匹配信息,在计算中保留了特征的通道维度并构建了4D cost volume,然后通过两个3D卷积层将通道数量减少到1。

自由画布 自由画布

百度文库和百度网盘联合开发的AI创作工具类智能体

自由画布 73 查看详情 自由画布

深度假设的采样方法与单视图分支一致,但采样数量仅为128,然后使用堆叠的2D沙漏网络进行正则化,以获得最终的多视图cost volume。为了补充单视图特征的丰富语义信息和由于成本正则化而丢失的细节,使用残差结构来组合单视图深度特征Ds和cost volume,以获得融合深度特征,如下所示:

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

自适应融合模块

为了获得最终准确和稳健的预测,设计了AF模块,以自适应地选择两个分支之间最准确的深度作为最终输出,如图2所示。通过三个confidence进行融合映射,其中两个是由两个分支分别生成的置信图Ms和Mm,最关键的一个是通过前向wrapping生成的置信度图Mw,以判断多视图分支的预测是否可靠。

实验结果

DDAD(自动驾驶的密集深度)是一种新的自动驾驶基准,用于在具有挑战性和多样化的城市条件下进行密集深度估计。它由6台同步相机拍摄,并包含高密度激光雷达生成的准确的地GT深度(整个360度视场)。它在单个相机视图中有12650个训练样本和3950个验证样本,其中分辨率为1936×1216。来自6台摄像机的全部数据用于训练和测试。KITTI数据集,提供运动车辆上拍摄的户外场景的立体图像和相应的3D激光scan,分辨率约为1241×376。

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

DDAD和KITTI上的评测结果对比。请注意,* 标记了使用其开源代码复制的结果,其他报告的数字来自相应的原始论文。

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

DDAD上方法中每种策略的消融实验结果。Single表示单视图分支预测的结果,Multi-表示多视图分支预测结果,Fuse表示融合结果dfuse。

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

消融结果的特征提取网络参数共享和提取匹配信息的方法。

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

深度估计SOTA!自动驾驶单目与环视深度的自适应融合深度估计SOTA!自动驾驶单目与环视深度的自适应融合

深度估计SOTA!自动驾驶单目与环视深度的自适应融合

以上就是深度估计SOTA!自动驾驶单目与环视深度的自适应融合的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/423752.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 10:41:05
下一篇 2025年11月7日 10:45:25

相关推荐

  • B安交易所苹果手机版APP官方最新安装链接

    B安交易所无疑是举足轻重的存在。对于使用苹果手机的用户来说,如何安全、便捷地安装B安交易所的APP,是进入这个数字资产大门的关键一步。本文将提供B安交易所苹果手机版APP的官方最新安装链接,并详细指导安装过程,确保您能顺利开启数字货币之旅。请务必仔细阅读以下内容,因为任何疏忽都可能导致安装失败或安全…

    2025年12月8日
    000
  • linux属于什么系统

    linux属于一种类UNIX操作系统。Linux,全称GNU/Linux,是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和Unix的多用户、多任务、支持多线程和多CPU的操作系统。 本文操作环境:red hat enterprise linux 7.4系统、thinkpad t4…

    2025年12月5日
    000
  • win10如何回退到上一个版本_win10系统版本回退操作指南

    可通过系统设置在升级后10天内回退到旧版Windows;2. 确保C盘保留windows.old等关键文件夹以维持回退能力;3. 使用升级前创建的系统还原点可恢复系统状态。 如果您在升级Windows系统后遇到兼容性问题或运行不稳定,可以考虑回退到之前的版本以恢复正常使用。以下是进行系统版本回退的操…

    2025年12月4日
    000
  • linux是一个什么系统

    linux是一个基于POSIX的多用户、多任务并且支持多线程和多CPU的操作系统;linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。 本教程操作环境:linux5.9.8系统、Dell G3电脑。 Linux,全称GNU/Linux,是一种免费使用和自由传播的类UN…

    2025年12月4日
    000
  • 华为EMUI11底部小白条怎么设置_华为EMUI11底部小白条设置教程

    遇到%ignore_a_1%手机emui11底部小白条使用不便的问题了吗?php小编鱼仔这就为大家带来emui11底部小白条的设置方法介绍,以下内容将详细解析小白条的设置教程,帮助大家轻松解决使用困扰。 1、打开手机设置,找到【系统和更新】,并点击打开。 2、进入系统和更新界面后,点击【系统导航方式…

    2025年12月4日 手机教程
    000
  • 华为p20中打开开发人员选项的操作步骤

    华为p20中开启开发人员选项可以让你访问额外的设置和功能,以便进行自定义、调试和性能调整。php小编西瓜今天将为你提供一步一步的指南,让你轻松地启用开发人员选项,释放你的手机的全部潜力。 1、首先点击打开p20手机桌面上的【设置】, 2、点击进入设置菜单下的【系统】。 3、在系统菜单下点击进入【开发…

    2025年12月3日
    000
  • 华为p20pro中设置日期和时间的操作步骤

    %ignore_a_1%手机中如何设置日期和时间?php小编柚子为大家带来华为p20pro中更改日期和时间设置的详细教程。想要了解如何完成这项操作的朋友,快来往下查看具体步骤吧! 1、打开华为p20pro的手机桌面,点击进入桌面上的【设置】。 2、下拉到底栏,点击进入【系统】。 3、在系统菜单下点击…

    2025年12月3日 手机教程
    000
  • 魅族 Note 16 系列新机明日发布,新系统也来了

    目前官方已经对这款新机进行了多次预热,外观设计和部分配置信息已经曝光。 官方预热海报显示,星纪魅族 Note 16 系列历经近 100 万次品质测试、近 100 项实验论证、超 480 小时严苛环境验证。 其中标准版机型采用直角边框设计,机身侧边还配有一枚按键,预计为单独的 AI 按键;后置 Dec…

    2025年12月3日 硬件教程
    100
  • 荣耀手机设置全面屏手势的操作流程

    荣耀手机使用全面屏手势,可以带来更加便捷的操作体验。php小编草莓将为大家详细介绍荣耀手机设置全面屏手势的操作流程,解决您在使用全面屏手机时的操作难题。请继续阅读以下内容,了解如何在荣耀手机上启用和自定义全面屏手势,让您的手机操作更加流畅高效。 第一步:我们点击进入荣耀手机桌面上的【设置】 第二步:…

    2025年12月3日
    000
  • 金明全民经纪系统操作指南

    谁做投资不想迅速获利、收益高又不亏损?然而市场风险无处不在,有没有一套无论行情如何都能稳赚的系统? 1、 第一步,建立个人投资圈,采用高效盈利模式——全民经纪系统,通过三级分销提成,汇聚朋友的力量,共享收益成果。 2、 你的朋友、客户、同事中,可能有渴望赚钱的投资新手,追求稳定回报的老手,或是喜欢分…

    2025年12月3日 软件教程
    000
  • 校管家学校管理软件:学习秀操作流程指南

    老师如何在手机端一次性选择多个班级发送通知?学员信息管理模块如何增加批量删除功能?排课记录是否支持多种导出方式? 1、 首先登录校管家手机客户端,进入师生信家长端个人主页。在学习秀页面中,点击右上角的分享图标,可以将内容分享给朋友或发布到朋友圈。 2、 有报名意向的人可通过分享链接进行提交,相关信息…

    2025年12月3日 软件教程
    000
  • 如何登录个人公积金查询系统

    1、 null 2、 登录支付宝界面,找到入口位置。 3、 接下来,选择相关选项。 4、 然后点击对应的选项。 快剪辑 国内⼀体化视频⽣产平台 54 查看详情 5、 随后,点击指定的按钮。 6、 完成点击操作后,登录成功。 以上就是如何登录个人公积金查询系统的详细内容,更多请关注创想鸟其它相关文章!

    2025年12月3日 软件教程
    000
  • 一建注册查询系统平台:轻松掌握注册动态

    一建注册查询平台,以下经验希望能帮到大家,接下来详细讲解具体的操作流程,一起了解下吧。 1、 登录注册建筑师管理系统官网,选择一级建筑师相关栏目。 2、 跳转页面后,点击个人入口按键。 3、 进入新界面,找到并点击人员资格查询功能。 快剪辑 国内⼀体化视频⽣产平台 54 查看详情 4、 填写相关信息…

    2025年12月3日 软件教程
    000
  • 华为p20中关闭后台应用的详细方法

    对于华为 p20 用户来说,关闭后台应用是一个常见的问题,它可以帮助释放内存并延长电池续航。php小编香蕉将介绍华为 p20 中关闭后台应用的详细方法,包括通过任务管理器和应用程序设置进行关闭。了解这些方法,您将能够有效地管理后台应用,优化手机性能,继续阅读以获取详细指南。 1、打开【设置】。 2、…

    2025年12月3日 手机教程
    000
  • 如何在打单时合并同一买家的多笔订单打印?

    在打印订单时,经常会出现这样的情况:一个买家同时下了多个订单,而收货信息完全一致,此时买家希望能将这些订单合并打印,从而减少面单的使用量。 启用此功能后,如果同一个买家购买了多件商品并且收件地址相同,系统将会自动将这个买家的多笔订单合并成一笔。这样一来,只需要打印一张面单即可完成发货,既降低了面单的…

    2025年12月3日 软件教程
    000
  • 萝卜家园Ghost Win10 64位专业珍藏版怎么安装-萝卜家园Ghost Win10 64位专业珍藏版安装的方法

    萝卜家园 ghost win10 64 位专业珍藏版是一款备受青睐的系统封装版本,其在系统性能、稳定性、安全性及易用性方面表现优异,深受用户欢迎。接下来就由华军小编为大家详细介绍萝卜家园ghost win10 64位专业珍藏版的安装步骤以及相关方法。 一、前期准备 备份数据将重要资料、照片、文档等保…

    2025年12月3日 软件教程
    000
  • 汽车美容维修管理系统应具备哪些功能

    标准化汽车美容维修管理系统,助力快修门店高效管理会员,支持会员卡储值、消费及配套读卡器使用,全面提升运营效率。 企业可根据实际业务需求将客户设为会员,会员在消费时可通过会员卡享受专属优惠与服务,并支持积分累积功能。 会员卡类型多样,包括积分卡、储值卡和等级卡(如金卡、银卡等)。积分卡用于累计消费积分…

    2025年12月3日 软件教程
    000
  • 酷我音乐极速下载开启方法

    打开酷我音乐应用,找到并点击菜单按钮,进入主菜单界面。 在菜单页面中,选择“设置”选项,进入系统设置界面。 无涯·问知 无涯·问知,是一款基于星环大模型底座,结合个人知识库、企业知识库、法律法规、财经等多种知识源的企业级垂直领域问答产品 153 查看详情 在设置界面中,找到相关下载或会员服务选项,开…

    2025年12月2日 软件教程
    000
  • 《天龙八部·归来》知识改变命运!科举乡试详细玩法介绍

    科举乡试 等级需求:30级 参与形式:单人活动 时间:周一至周六全天 活动简介:每天可以参加一次,共回答10道题。答1题即可获得1题的奖励,单次乡试答对6题,即可参加本周日全部三场的会试。 大侠可以点击界面右上角的修行书,在日常活动界面选择科举乡试,点击参加,即可开启活动,进入答题界面。 1.常识类…

    2025年12月2日 行业动态
    000
  • 淘宝死店铺赔付可靠吗?赔付的钱在哪里查看?规避风险的4个关键技巧快快收藏!

    在淘宝购物时,部分消费者可能会碰到一些长期未运营或无法正常发货的“死店铺”。这类店铺所产生的订单常常引发赔付纠纷:淘宝对于死店铺的赔付机制是否值得信赖?赔偿金额又该如何查询?本文将结合平台政策与实际操作经验,深入解读这一常见问题。 一、淘宝死店铺的赔付是否靠谱? 1. 平台赔付规则详解 淘宝针对未按…

    2025年12月2日
    100

发表回复

登录后才能评论
关注微信