3d
-
晶体管救命稻草来了:3D堆叠CMOS,摩尔定律又续10年?
晶体管,被誉为「20世纪最伟大的发明」。 它的出现为集成电路、微处理器以及计算机内存的产生奠定了基础。 1965年,「摩尔定律」的提出成为半导体行业几十年来的金科玉律。 它表明,每隔 18~24 个月,封装在微芯片上的晶体管数量便会增加一倍,芯片的性能也会随之翻一番。 ☞☞☞AI 智能聊天, 问答助…
-
深入探讨自动驾驶中的2D和3D视觉感知算法
环境感知是自动驾驶的第一环,是车辆和环境交互的纽带。一个自动驾驶系统整体表现的好坏,很大程度上都取决于感知系统的好坏。目前,环境感知技术有两大主流技术路线: ①以视觉为主导的多传感器融合方案,典型代表是特斯拉; ②以激光雷达为主导,其他传感器为辅助的技术方案,典型代表如谷歌、百度等。 我们将围绕着环…
-
眼球反射解锁3D世界,黑镜成真!马里兰华人新作炸翻科幻迷
「唯一真正的探索之旅,不是去拜访陌生的土地,而是透过别人的眼睛来观察宇宙。」——马塞尔·普鲁斯特 通过别人的眼睛来看世界,这个又科幻又诗意(又恐怖)的想法,已经成真了! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 《黑镜》第一季《你的全部…
-
无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA
通过对齐三维形状、二维图片以及相应的语言描述,多模态预训练方法也带动了3D表征学习的发展。 不过现有的多模态预训练框架收集数据的方法缺乏可扩展性,极大限制了多模态学习的潜力,其中最主要的瓶颈在于语言模态的可扩展性和全面性。 最近,Salesforce AI联手斯坦福大学和得克萨斯大学奥斯汀分校,发布…
-
FlashOcc:占用预测新思路,精度、效率和内存占用新SOTA!
原标题:flashocc: fast and memory-efficient occupancy prediction via channel-to-height plugin 论文链接:https://arxiv.org/pdf/2311.12058.pdf 作者单位:大连理工大学 Houmo …
-
NeRF在BEV泛化性能方面的突破:首个跨域开源代码成功实现Sim2Real
写在前面&笔者的个人总结 鸟瞰图(Bird eye’s view, BEV)检测是一种通过融合多个环视摄像头来进行检测的方法。目前算法大部分算法都是在相同数据集训练并且评测,这导致了这些算法过拟合于不变的相机内参(相机类型)和外参(相机摆放方式)。本文提出了一种基于隐式渲染的BE…
-
跨模态占据性知识的学习:使用渲染辅助蒸馏技术的RadOcc
原标题:radocc: learning cross-modality occupancy knowledge through rendering assisted distillation 论文链接:https://arxiv.org/pdf/2312.11829.pdf 作者单位:FNii, C…
-
OccFusion:一种简单有效的Occ多传感器融合框架(性能SOTA)
对3d场景的全面理解在自动驾驶中至关重要,最近的3d语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而,现有的3d占用预测方法在很大程度上依赖于全景相机图像,这使得它们容易受到照明和天气条件变化的影响。通过集成激光雷达和环视雷达等附加传感器的功能,本文的框架提高了占用预…
-
摆脱编码器依赖!Encoder-free 3D 多模态大模型,性能超越 13B 现有 SOTA
突破性进展:无编码器3d多模态大模型enel问世! 这项由上海AI Lab、西北工业大学、香港中文大学和清华大学等机构联合研发的ENEL模型,将无编码器多模态大模型拓展到了3D领域,实现了对不同点云分辨率的适应性,并彻底摆脱了对预训练编码器的依赖。 ENEL在Objaverse基准测试中表现卓越,性…
-
李飞飞世界模型大更新! 实时生成 3D 世界,只要一块 GPU
当 OpenAI 的奥特曼还在到处买显卡、买算力,来支撑他的 Sora 2 视频生成模型。 李飞飞的实验室 The World Labs,用一张显卡就能运行一个世界。他们今天发布了一项名为 RTFM ( Real-Time Frame Model ) 的新技术,一个全新的实时世界生成模型。 和九月中…