遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

回归到地面的高度,以实现距离不可知的公式,从而简化仅相机感知方法的优化过程。在路侧camera的3d检测基准上,方法大大超过了以前所有以视觉为中心的方法。它比bevdepth产生了+1.9%的nds和+1.1%的map的显著改善。在nuscenes测试集上,方法取得了实质性的进步,nds和map分别增加了+2.8%和+1.7%。

标题:BEVHeight++:朝着稳健的视觉中心化3D物体检测迈进

论文链接:https://arxiv.org/pdf/2309.16179.pdf

作者单位:清华大学、中山大学、菜鸟网络、北京大学

出自国内首个自动驾驶社区:终于完成了20+技术方向学习路线的搭建(BEV感知/3D检测/多传感器融合/SLAM与规划等)

尽管最近的自动驾驶系统专注于开发车辆传感器的感知方法,但人们往往忽视了一种利用智能路边摄像头将感知能力扩展到视觉范围之外的替代方法。作者发现,最先进的以视觉为中心的BEV检测方法在路边摄像头上的性能较差。这是因为这些方法主要集中在恢复关于相机中心的深度,在相机中心,汽车和地面之间的深度差随着距离的增加而迅速缩小。在本文中,作者提出了一种简单而有效的方法,称为BEVHeight++,来解决这个问题。本质上,作者回归到地面的高度,以实现距离不可知的公式,从而简化仅相机感知方法的优化过程。通过结合高度和深度编码技术,实现了从2D到BEV空间的更准确和稳健的投影。在路边摄像头的流行3D检测基准上,方法大大超过了以前所有以视觉为中心的方法。就自车辆场景而言,BEVHeight++具有优于仅深度的方法

具体而言,在nuScenes验证集上进行评估时,它比BEVDepth产生了+1.9%的NDS和+1.1%的mAP的显著改善。此外,在nuScenes测试集上,方法取得了实质性的进步,NDS和mAP分别增加了+2.8%和+1.7%。

ImagetoCartoon ImagetoCartoon

一款在线AI漫画家,可以将人脸转换成卡通或动漫风格的图像。

ImagetoCartoon 106 查看详情 ImagetoCartoon

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

图1:(a)为了从单目图像中产生3D边界框,最先进的方法首先显式或隐式地预测每像素深度,以确定前景对象与背景的3D位置。然而,当我们在图像上绘制每像素深度时,我们注意到,当汽车远离相机时,车顶和周围地面上的点之间的差异会迅速缩小,这使得优化变得次优,尤其是对于远处的物体。(b) 相反,我们绘制了到地面的每像素高度,并观察到无论距离如何,这种差异都是不可知的,并且在视觉上更适合网络检测目标。然而,不能仅通过预测高度来直接回归3D位置。(c) 为此,我们提出了一个新的框架BEVHeight++来解决这个问题。经验结果表明,我们的方法在干净设置上超过了最佳方法5.49%,在嘈杂设置上超过28.2%。

网络结构

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

预测高度和深度的比较。(a) 概述了以前基于深度的方法和我们提出的基于高度的管道。请注意,本文提出了一种新颖的2D到3D投影模块。(b) 绘制每像素深度(顶部)和地面高度(底部)的直方图,可以清楚地观察到,深度范围超过200米,而高度在5米以内,这使得高度更容易学习。

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

在图像中,目标的行坐标与其深度和高度之间存在相关性。目标在图像中的位置可以用(u,v)来定义,其中v表示图像的行坐标。在(a)中,我们展示了一个视觉示例,通过在正态分布中添加滚转和俯仰方向的旋转偏移来引入噪声。在(b)中,我们展示了深度分布的散点图。在(c)中,我们展示了离地高度。我们可以观察到,与深度相比,高度的噪声设置与其原始分布有更大的重叠,这表明高度估计更具鲁棒性

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

BEVHeight++的总体框架包含三个子网络,分别是基于深度的分支(青色)、基于高度的分支(绿色)和特征融合过程(灰色)。基于深度的pipeline使用估计的每像素深度将图像视图特征转换为基于深度的BEV特征(基于D的BEV)。基于高度的pipeline利用对图像视图中升力特征的地面高度预测,生成基于高度的BEV特征(基于H的BEV)。特征融合包括图像融合和鸟瞰融合。图像-视图融合通过级联高度分布和图像特征,得到融合特征,用于后续的提升操作。鸟瞰图融合通过可变形交叉注意力从基于高度的BEV特征和基于深度的BEV特性中获得融合的BEV特点,然后将其作为检测头的输入

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

实验结果

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!

需要进行改写的内容是:原文链接:https://mp.weixin.qq.com/s/AdCXYzHIy2lTfAHk2AZ4_w

以上就是遥遥领先!BEVHeight++:针对路侧视觉3D目标检测新方案!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1050057.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月2日 09:59:53
下一篇 2025年12月2日 10:00:14

相关推荐

  • 荣耀开始安排 6.3-6.5 英寸中小尺寸机型?两款新机曝光

    荣耀将推出中小尺寸屏幕新机型!据数码闲聊站爆料,荣耀计划发布两款中端机型,分别采用6.5英寸左右1.5k直屏和6.78英寸左右1.5k等深四曲屏,均配备7000毫安时以上大电池,并搭载骁龙7 gen 4处理器(sm7750),预计上半年发布。 爆料显示,荣耀正在积极布局中小尺寸手机市场,目前已启动6…

    2025年12月6日 硬件教程
    000
  • vivo Y300 Pro+评测:同档续航最强?

    作为vivo y系列十四周年纪念机型,y300 pro+以“样样加倍”的理念重新定义了中端机的标准。 为了解并解决用户的痛点,进一步巩固“国民手机”的定位,Y300 Pro+携“续航灭霸”的称号进入中端手机市场。 vivo Y300 Pro+肩负着“续航最强的全能国民手机”的使命,向同级别竞争对手发…

    2025年12月6日 硬件教程
    000
  • 怎样用免费工具美化PPT_免费美化PPT的实用方法分享

    利用KIMI智能助手可免费将PPT美化为科技感风格,但需核对文字准确性;2. 天工AI擅长优化内容结构,提升逻辑性,适合高质量内容需求;3. SlidesAI支持语音输入与自动排版,操作便捷,利于紧急场景;4. Prezo提供多种模板,自动生成图文并茂幻灯片,适合学生与初创团队。 如果您有一份内容完…

    2025年12月6日 软件教程
    000
  • JetBrains 发布 Junie AI 编程智能体 可执行编写调试等多步任务

    近日,jetbrains 正式宣布,其 ai 编程智能体 junie ai 已达到 ” 生产就绪 ” ( production-ready ) 状态。这意味着 junie ai 已经具备执行编写代码、调试运行等多步骤任务的能力,为开发者提供强大的 ai 支持。与此同时,jet…

    2025年12月6日 硬件教程
    000
  • Pages怎么协作编辑同一文档 Pages多人实时协作的流程

    首先启用Pages共享功能,点击右上角共享按钮并选择“添加协作者”,设置为可编辑并生成链接;接着复制链接通过邮件或社交软件发送给成员,确保其使用Apple ID登录iCloud后即可加入编辑;也可直接在共享菜单中输入邮箱地址定向邀请,设定编辑权限后发送;最后在共享面板中管理协作者权限,查看实时在线状…

    2025年12月6日 软件教程
    000
  • 各种手机处理器性能排行榜2025 全品牌手机性能处理器前十名推荐

    2025年全品牌手机性能处理器前十名分别是:1.联发科天玑9400 ,2.苹果A18 Pro,3.高通骁龙8至尊版,4.联发科天玑9300,5.高通骁龙8 Gen4,6.三星Exynos 2500,7.苹果A18 Bionic,8.华为麒麟9100,9.联发科天玑9200 ,10.高通骁龙7  Ge…

    2025年12月6日 硬件教程
    000
  • 哔哩哔哩的视频卡在加载中怎么办_哔哩哔哩视频加载卡顿解决方法

    视频加载停滞可先切换网络或重启路由器,再清除B站缓存并重装应用,接着调低播放清晰度并关闭自动选分辨率,随后更改播放策略为AVC编码,最后关闭硬件加速功能以恢复播放。 如果您尝试播放哔哩哔哩的视频,但进度条停滞在加载状态,无法继续播放,这通常是由于网络、应用缓存或播放设置等因素导致。以下是解决此问题的…

    2025年12月6日 软件教程
    000
  • cpu天梯图最新排名2025 手机cpu处理器排行榜天梯图top10

    骁龙 8 Gen4、天玑 9400、A18 Pro 和 Exynos 2400 是当前旗舰处理器,分别适用于高端游戏、AI 创作、iOS 生态和游戏玩家。 立即进入“各种好用的网站点击进入”; 一、旗舰处理器(性能天花板) 1. 高通骁龙 8 Gen4 核心配置:1×Cortex-X5(3.8GHz…

    2025年12月6日 硬件教程
    000
  • 商业市场AI绽放的秘密,藏在伙伴协同创新的“黑土地”里

    在ai深度赋能千行百业的浪潮中,企业数量庞大、覆盖范围广泛的商业市场正成为推动数智化变革的核心力量,其转型路径与实践模式日益受到关注。 据权威机构发布的数据显示,我国工业、批发零售住宿餐饮以及服务业三类规模以上企业的总数已突破百万,其资产规模、营收、利润及税收贡献占所有市场主体总量的80%以上,堪称…

    2025年12月6日 行业动态
    000
  • Linux中如何安装Nginx服务_Linux安装Nginx服务的完整指南

    首先更新系统软件包,然后通过对应包管理器安装Nginx,启动并启用服务,开放防火墙端口,最后验证欢迎页显示以确认安装成功。 在Linux系统中安装Nginx服务是搭建Web服务器的第一步。Nginx以高性能、低资源消耗和良好的并发处理能力著称,广泛用于静态内容服务、反向代理和负载均衡。以下是在主流L…

    2025年12月6日 运维
    000
  • 当贝X5S怎样看3D

    当贝X5S观看3D影片无立体效果时,需开启3D模式并匹配格式:1. 播放3D影片时按遥控器侧边键,进入快捷设置选择3D模式;2. 根据片源类型选左右或上下3D格式;3. 可通过首页下拉进入电影专区选择3D内容播放;4. 确认片源为Side by Side或Top and Bottom格式,并使用兼容…

    2025年12月6日 软件教程
    000
  • Linux journalctl与systemctl status结合分析

    先看 systemctl status 确认服务状态,再用 journalctl 查看详细日志。例如 nginx 启动失败时,systemctl status 显示 Active: failed,journalctl -u nginx 发现端口 80 被占用,结合两者可快速定位问题根源。 在 Lin…

    2025年12月6日 运维
    000
  • 华为新机发布计划曝光:Pura 90系列或明年4月登场

    近日,有数码博主透露了华为2025年至2026年的新品规划,其中pura 90系列预计在2026年4月发布,有望成为华为新一代影像旗舰。根据路线图,华为将在2025年底至2026年陆续推出mate 80系列、折叠屏新机mate x7系列以及nova 15系列,而pura 90系列则将成为2026年上…

    2025年12月6日 行业动态
    000
  • Linux如何防止缓冲区溢出_Linux防止缓冲区溢出的安全措施

    缓冲区溢出可通过栈保护、ASLR、NX bit、安全编译选项和良好编码实践来防范。1. 使用-fstack-protector-strong插入canary检测栈破坏;2. 启用ASLR(kernel.randomize_va_space=2)随机化内存布局;3. 利用NX bit标记不可执行内存页…

    2025年12月6日 运维
    000
  • Linux如何优化系统性能_Linux系统性能优化的实用方法

    优化Linux性能需先监控资源使用,通过top、vmstat等命令分析负载,再调整内核参数如TCP优化与内存交换,结合关闭无用服务、选用合适文件系统与I/O调度器,持续按需调优以提升系统效率。 Linux系统性能优化的核心在于合理配置资源、监控系统状态并及时调整瓶颈环节。通过一系列实用手段,可以显著…

    2025年12月6日 运维
    000
  • OPPO智慧服务吹起AI之风,移动开发拨云见日

    移动应用服务的迅猛发展,让我们的日常需求几乎都能通过一部手机轻松实现。然而,在繁荣表象之下,开发者正面临一场严峻的“可见性危机”。 用户手机中动辄安装上百款App,即便所需服务早已存在,关键时刻却难以迅速找到并使用。而开发者倾注心血打造的功能,往往因入口深藏、触达时机不准,无法有效抵达目标用户,在高…

    2025年12月6日 行业动态
    000
  • OPPO 开放式耳机 Enco Clip 亮相 单次充电可连续播放 9.5 小时

    5月7日,oppo首次推出开放式耳夹式耳机——oppo enco clip,这款耳机瞄准中端市场,预计将于5月15日正式发布,售价预计在千元以下。 在外观设计上,OPPO Enco Clip推出了珠光海和星岩灰两种颜色,采用了别致的小豆夹设计。用户无需将耳机塞入耳道,只需轻轻夹在耳朵上即可享受音乐。…

    2025年12月6日 硬件教程
    000
  • Linux中如何查看磁盘空间_Linux磁盘空间查看的多种方式

    使用df、du、lsblk等命令可全面查看Linux磁盘空间。1. df -h查看文件系统使用情况,显示总容量、已用、可用空间及挂载点;df -i检查inode使用,df -T显示文件系统类型。2. du -sh查看指定目录总大小,du -h –max-depth=1分析子目录占用,结合…

    2025年12月6日 运维
    000
  • 首款鸿蒙电脑惊艳亮相,华为重构电脑产业新格局

    华为鸿蒙电脑技术与生态沟通会隆重举行,首款鸿蒙电脑惊艳登场,这一标志性事件预示着华为在电脑领域迈出了具有深远影响的关键一步,为国产电脑产业带来了全新的革新与发展契机。 鸿蒙电脑的推出并非一朝一夕之功,而是华为经过五年精心策划的结果。在此期间,华为汇聚了超过10000名顶尖工程师,与20多家专业研究所…

    2025年12月6日 硬件教程
    000
  • Linux密码策略如何配置_Linux密码策略配置的详细指南

    答案:Linux密码策略通过PAM模块和配置文件设置密码复杂度、有效期、重复使用限制及账户锁定规则,提升系统安全。具体包括:1. 配置pam_pwquality.so实现最小长度8位、含大小写字母、数字、特殊字符,允许输错3次;2. 修改/etc/login.defs设置密码最长使用90天、最短7天…

    2025年12月6日 运维
    000

发表回复

登录后才能评论
关注微信