FlashOcc：占用预测新思路，精度、效率和内存占用新SOTA！

程序猿 • 2025年11月8日 01:56:04 • 用户投稿 • 阅读 0

原标题：flashocc: fast and memory-efficient occupancy prediction via channel-to-height plugin

论文链接：https://arxiv.org/pdf/2311.12058.pdf

作者单位：大连理工大学 Houmo AI 阿德莱德大学

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文思路：

鉴于能够缓解 3D 目标检测中普遍存在的长尾缺陷和复杂形状缺失的能力，占用预测已成为自动驾驶系统的关键组成部分。然而，三维体素级表示的处理不可避免地会在内存和计算方面引入大量开销，阻碍了迄今为止的占用预测方法的部署。与使模型变得更大、更复杂的趋势相反，本文认为理想的框架应该对不同的芯片进行部署友好，同时保持高精度。为此，本文提出了一种即插即用范例，即 FlashOCC，以巩固快速且节省内存的占用预测，同时保持高精度。特别是，本文的 FlashOCC 基于当代体素级占用预测方法做出了两项改进。首先，特征保留在 BEV 中，从而能够使用高效的 2D 卷积层进行特征提取。其次，引入通道到高度变换(channel-to-height transformation) ，将 BEV 的输出 logits 提升到 3D 空间。本文将 FlashOCC 应用于具有挑战性的 Occ3D-nuScenes 基准的各种占用预测基线，并进行广泛的实验来验证其有效性。结果证实了本文的即插即用范例在精度、运行时效率和内存成本方面优于以前最先进的方法，展示了其部署潜力。该代码将可供使用。

网络设计：

受到 sub-pixel convolution 技术[26] 的启发，我们将图像上采样替换为通道重新排列，以实现通道到空间的特征转换。在本文的研究中，我们的目标是有效地实现通道到高度的特征转换。考虑到 BEV 感知任务的发展，其中 BEV 表示中的每个像素包含有关相应柱状物体在高度维度上的信息，我们直观地利用通道到高度变换（channel-to-height transformation）将扁平化的 BEV 特征重新塑造为三维体素级别的占用 logits。因此，我们的研究专注于以通用和即插即用的方式增强现有模型，而不是开发新颖的模型架构，如图1 (a) 所示。具体来说，我们直接使用 2D 卷积替代当代方法中的 3D 卷积，并用通过 2D 卷积获得的 BEV 级特征的通道到高度变换替换从 3D 卷积输出中得到的占用 logits。这些模型不仅实现了准确性和时间消耗之间的最佳权衡，还展现出了出色的部署兼容性

FlashOcc 成功地以极高的精度成功完成了实时环视 3D 占用预测，代表了该领域的开创性贡献。此外，它还展现了跨不同车载平台部署的增强的多功能性，因为它不需要昂贵的体素级特征处理，其中避免了 view transformer 或 3D（可变形）卷积算子。如图2所示，FlashOcc的输入数据由环视图像组成，而输出是密集的占用预测结果。尽管本文的FlashOcc专注于以通用和即插即用的方式增强现有模型，但它仍然可以分为五个基本模块：（1）2D图像编码器，负责从多相机图像中提取图像特征。(2) 视图转换模块，有助于将 2D 感知视图图像特征映射到 3D BEV 表示。(3) BEV 编码器，负责处理 BEV 特征信息。(4) 占用预测模块，预测每个体素的分割标签。(5) 一个可选的时间融合模块，旨在集成历史信息以提高性能。

图 1.(a) 说明了如何以即插即用的方式实现所提出的 FlashOcc。现代方法使用 3D-Conv 处理的体素级 3D 特征来预测占用率。相比之下，本文的插件替代模型通过 (1) 用 2D-Conv 替换 3D-Conv 以及 (2) 用通道到高度变换(channel-to-height transformation) 替换从 3D-Conv 导出的占用 logits，实现快速且节省内存的占用预测通过 2D-Conv 获取的 BEV 级特征。缩写“Conv”代表卷积。(b) 举例说明了准确性与速度、推理内存消耗和训练持续时间等因素之间的权衡。

boardmix博思白板

boardmix博思白板，一个点燃团队协作和激发创意的空间，集aigc，一键PPT，思维导图，笔记文档多种创意表达能力于一体，将团队工作效率提升到新的层次。

39 查看详情

图 2. 该图说明了 FlashOcc 的总体架构，最好以彩色方式查看并具有缩放功能。虚线框指定的区域表示存在可更换模块。每个可更换模块的特征形状分别由代表 2D 图像、BEV 级和体素级特征的图标表示。浅蓝色区域对应于可选的时间融合模块，其使用取决于红色开关的激活。

图4展示了3D体素级表示处理和本文提出的插件替换之间的架构比较

实验结果：

总结：

本文介绍了一种名为FlashOCC的即插即用方法，旨在实现快速且内存高效的占用预测。此方法使用2D卷积直接替换基于体素的占用方法中的3D卷积，并结合通道到高度变换（channel-to-height transformation）将扁平化的BEV特征重新塑造为占用logits。FlashOCC已在多种体素级占用预测方法中证明了其有效性和通用性。大量实验证明该方法在精度、时间消耗、内存效率和部署友好性方面优于以前最先进的方法。据本文所知，FlashOCC是第一个将sub-pixel范式（Channel-to-Height）应用于占用任务的方法，专门利用BEV级特征，完全避免使用计算3D（可变形）卷积或transformer模块。可视化结果令人信服地证明FlashOCC成功保留了高度信息。在未来的工作中，该方法将被集成到自动驾驶的感知管道中，旨在实现高效的on-chip部署

引用：

Yu, Z., Shu, C., Deng, J., Lu, K., Liu, Z., Yu, J., Yang, D., Li, H., & Chen, Y. (2023). FlashOcc: Fast and Memory-Efficient Occupancy Prediction via Channel-to-Height Plugin. ArXiv. /abs/2311.12058

原文链接：https://mp.weixin.qq.com/s/JDPlWj8FnZffJZc9PIsvXQ

以上就是FlashOcc：占用预测新思路，精度、效率和内存占用新SOTA！的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/457153.html

3d 自动驾驶

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

laravel框架流程是什么

上一篇 2025年11月8日 01:56:04

《王者荣耀世界》今日开启预约：《王者荣耀》同世界观衍生RPG游戏

下一篇 2025年11月8日 01:56:06

利用纯CSS创建 3D 穿梭效果（附代码）

怎么创建3d 穿梭效果？实现一种加速动画效果？下面本篇文章就来给大家介绍一下如何使用纯css来轻松搞定它！希望对大家有所帮助！周末在家习惯性登陆 Apex，准备玩几盘。在登陆加速器的过程中，发现加速器到期了。我一直用的腾讯网游加速器，然而点击充值按钮，提示最近客户端升级改造，暂不支持充值（这个操…

程序猿
2025年12月24日 • 用户投稿
1000
纯CSS3实现3d立体文字效果（源码分析）

本篇文章带大家了解一下3d文字效果的实现原理，没有考虑代码的复用性和可移植性，有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。 1.单单纯纯的效果一为了简化操作，我们使用和上一篇文章《纯CSS3文字效果推荐》一样的文档结构，后面的效果大差小不差，也就不再列出。前端开发whqet …

程序猿
2025年12月24日 • 用户投稿
2000
纯CSS3实现3D翻转效果的代码示例

本篇文章给大家带来的内容是关于纯CSS3实现3D翻转效果的代码示例，有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。作为前端开发人员的必修课，CSS3能带我们完成许多基本动效，本期我们将用CSS3实现hover翻转效果~ 第一步非常简单，我们简单画1个演示方块，为其添加transit…

程序猿
2025年12月24日 • 用户投稿
0000
CSS3 3D旋转rotate效果的使用介绍

这篇文章主要为大家详细介绍了css3 3d旋转rotate效果实例，具有一定的参考价值，感兴趣的小伙伴们可以参考一下本文实例为大家分享了CSS3 3D旋转rotate效果实例，供大家参考，具体内容如下效果图：示例代码立即学习“前端免费学习笔记（深入）”； 3D旋转的Demo #experim…

程序猿
2025年12月24日 • 用户投稿
0000
用户投稿

如何利用CSS3实现3D翻书效果

这篇文章主要介绍了css3实现3d翻书效果，基于css3新属性animation及transform实现类似翻书效果，具有一定的参考价值，感兴趣的小伙伴们可以参考一下先上效果图：（样式有点丑，可以忽略一下下，效果出来了就好，后期加到其他项目中方便更改0.0）类似翻书效果，原本的意思是使用JS来控…

程序猿
2025年12月24日
0000
用户投稿

关于css过渡和3D效果的简单实现

下面为大家带来一篇css过渡+3d效果的简单实现。内容挺不错的，现在就分享给大家，也给大家做个参考。 css过渡+3D效果的简单实现 guodu#wp{ border: 1px solid red; width: 500px; height: 500px; background-color: pin…

程序猿
2025年12月24日
0000
用css3简单的制作3d半透明立方体图片详解

new document //css部分html{font-size:62.5%;}img{width:300px;height:300px;} #stage{//搭建一个舞台margin-top:200px;margin-left:auto;margin-right:auto;width:300p…

程序猿
用户投稿 2025年12月23日
0000
教你玩转CSS3的3D效果

css3的3d起步要玩转css3的3d，就必须了解几个词汇，便是透视(perspective)、旋转(rotate)和移动(translate)。透视即是以现实的视角来看屏幕上的2d事物，从而展现3d的效果。旋转则不再是2d平面上的旋转，而是三维坐标系的旋转，就包括x轴，y轴，z轴旋转。平移同理。…

程序猿
2025年12月23日 • 用户投稿
0000
用户投稿

如何搭建C++自动驾驶环境 Apollo平台配置

搭建C++自动驾驶环境需先配置Ubuntu系统、Docker及NVIDIA驱动，再克隆Apollo代码并构建Docker镜像，进入容器后用bazel编译，启动Dreamview可视化界面，选择地图与模块运行Demo；常见问题如编译失败可清理缓存或更新依赖，自定义车辆模型和地图需掌握URDF与prot…

程序猿
2025年12月18日
0000
如何配置C++的自动驾驶规划环境 Apollo规划模块二次开发

为什么apollo规划模块的二次开发需要特定的环境配置？apollo使用docker和bazel是为了处理复杂的依赖关系、确保构建一致性、支持gpu加速以及提升团队协作效率。2. 在apollo环境中进行规划模块二次开发的关键步骤包括：准备宿主机环境、克隆apollo仓库、进入docker环境、编译…

程序猿
2025年12月18日 • 用户投稿
0000
自动驾驶实时系统：确定性内存分配器开发指南

自动驾驶实时系统对确定性内存分配器的需求，是为了确保内存操作在可预测时间内完成，从而保障系统的稳定与安全。1. 预分配和内存池通过预先分配固定大小的内存块，实现o(1)时间复杂度的快速分配与释放，但可能导致内存浪费；2. bump allocator使用移动指针的方式实现极快的分配，但通常不支持单独…

程序猿
2025年12月18日 • 用户投稿
0000
用户投稿

如何在C++中进行自动驾驶和智能导航开发？

如何在C++中进行自动驾驶和智能导航开发？自动驾驶和智能导航是当今科技发展的热门领域之一。随着计算机硬件技术的快速发展和算法的不断完善，C++语言在自动驾驶和智能导航领域的应用越来越广泛。本文将介绍如何在C++中进行自动驾驶和智能导航的开发，并提供代码示例。传感器数据获取与处理自动驾驶和智能导…

程序猿
2025年12月17日
0000
用户投稿

如何实现C++中的自动驾驶和智能交通系统？

如何实现C++中的自动驾驶和智能交通系统？自动驾驶和智能交通系统是目前人工智能领域的热门话题，它们的应用领域涉及到交通运输、安全防护和城市规划等多个方面。本文将探讨如何使用C++编程语言实现自动驾驶和智能交通系统，并提供相关的代码示例。了解自动驾驶和智能交通系统基本原理自动驾驶系统是指通过计算机…

程序猿
2025年12月17日
1000
当贝X5S怎样看3D

当贝X5S观看3D影片无立体效果时，需开启3D模式并匹配格式：1. 播放3D影片时按遥控器侧边键，进入快捷设置选择3D模式；2. 根据片源类型选左右或上下3D格式；3. 可通过首页下拉进入电影专区选择3D内容播放；4. 确认片源为Side by Side或Top and Bottom格式，并使用兼容…

程序猿
2025年12月6日 • 用户投稿
1000
《无限世界》【宇宙奥秘】盛大开服四大职业任您挑选

2024年11月2日14:00，《无限世界》新服揭幕，期待您的探索！领取媒体礼包与享受新服专享活动，就可以体验畅玩多元宇宙的乐趣！快来精选只属于您的职业吧！以下是每个职业的简要介绍：一、科幻战士（特种兵）特点：科幻战士拥有强大的科技装备和高超的战斗技巧。他们擅长使用各种高科技武器，如激光枪、电…

程序猿
2025年12月2日 • 用户投稿
0000
无需电池即可实现「自动驾驶」，华盛顿大学开发出无限续航的机器人

不装电池，也能%ignore_a_1%的“车”出现了。甚至还会自动收集能量持续运行，完全没有里程焦虑（手动狗头）。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 不错，这么一个小机器人，其实靠的是光和无线电波供能。其名MilliMobil…

程序猿
2025年12月2日 • 用户投稿
0000
BEV下的Radar-Camera 融合跨数据集实验研究

原标题：cross-dataset experimental study of radar-camera fusion in bird’s-eye view论文链接：https://arxiv.org/pdf/2309.15465.pdf作者单位：opel automobile gmbh rhein…

程序猿
2025年12月2日 • 用户投稿
0000
遥遥领先！BEVHeight++：针对路侧视觉3D目标检测新方案！

回归到地面的高度，以实现距离不可知的公式，从而简化仅相机感知方法的优化过程。在路侧camera的3d检测基准上，方法大大超过了以前所有以视觉为中心的方法。它比bevdepth产生了+1.9%的nds和+1.1%的map的显著改善。在nuscenes测试集上，方法取得了实质性的进步，nds和map分别…

程序猿
2025年12月2日 • 用户投稿
0000
改进自动驾驶在不确定环境下的轨迹规划方法

论文题目：《基于改进的模型预测控制的自动驾驶车辆在不确定环境下的轨迹规划方法》发表期刊：IEEE Transactions on Intelligent Transportation Systems 发布日期：2023年04月以下是我自己的論文閱讀筆記，主要是我自己覺得重點的部分，非全文翻譯，該…

程序猿
2025年12月2日 • 用户投稿
3000
LeCun对自动驾驶独角兽的造假行为深感失望

你以为这是一个普通的自动驾驶视频吗？ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 图片这个内容需要重新写成中文，而不改变原来的意思没有一帧是“真的”。图片不同路况、各种天气，20多种情况都能模拟，效果以假乱真。图片世界模型再次…

程序猿
2025年12月2日 • 用户投稿
0000