新标题:实时渲染进化!基于射线的三维重建创新方法

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

新标题:实时渲染进化!基于射线的三维重建创新方法图片

论文链接:https://arxiv.org/pdf/2310.19629

代码链接:https://github.com/vLAR-group/RayDF

主页:需要进行改写的内容是:https://vlar-group.github.io/RayDF.html

重新撰写的内容:实施方法:

新标题:实时渲染进化!基于射线的三维重建创新方法

RayDF的整体流程和组成部分如下所示(见图1)

一、Introduction

机器视觉和机器人领域的许多前沿应用中,学习准确且高效的三维形状表达是非常重要的。然而,现有的基于三维坐标的隐式表达在表示三维形状或是渲染二维图像时,需要耗费昂贵的计算成本;相比之下,基于射线的方法能够高效地推断出三维形状。然而,已有的基于射线的方法没有考虑到多视角下的几何一致性,导致在未知视角下难以恢复出准确的几何形状

针对这些问题,本论文提出一个全新的维护了多视角几何一致性的基于射线的隐式表达方法RayDF。该方法基于简单的射线-表面距离场(ray-surface distance field),通过引入全新的双射线可见性分类器(dual-ray visibility classifier)和多视角一致性优化模块(multi-view consistency optimization module),学习得到满足多视角几何一致的射线-表面距离。实验结果表明,改方法在三个数据集上实现了优越的三维表面重建性能,并达到了比基于坐标的方法快1000倍的渲染速度(见Table 1)。

新标题:实时渲染进化!基于射线的三维重建创新方法

以下是主要的贡献:

采用射线-表面距离场来表示三维形状,这个表达比现有的基于坐标的表达更高效。
设计了全新的双射线可见性分类器,通过学习任意一对射线的空间关系,使得所学的射线-表面距离场能够在多视角下保持几何一致性。
在多个数据集上证明了该方法在三维形状重建上的准确性和高效性。

二、Method

2.1 Overview

如图1所示,RayDF包含两个网络及一个优化模块。对于主网络ray-surface distance network,只需输入一条射线,即可得到射线起点到射线打到的几何表面点之间的距离值。其中,如图2所示,RayDF使用一个包围三维场景的球对输入的射线进行参数化,将参数化得到的四维球坐标(入射点和出射点)作为网络输入。对于辅助网络dual-ray visibility classifier,输入一对射线和一个几何表面点,预测两条射线之间的相互可见性。这个辅助网络在训练好之后,将在后续multi-view consistency optimization module中起到关键作用。

新标题:实时渲染进化!基于射线的三维重建创新方法

图 2 射线-表面距离场的射线参数化及网络结构

2.2 Dual-ray Visibility Classifier

该方法中的辅助网络是一个预测输入的两条射线是否能同时看到一个表面点的二元分类器。如图3所示,将输入的两条射线所得特征取平均值,以确保预测的结果不受两条射线的顺序所影响。同时,将表面点进行单独编码得到的特征拼接在射线特征之后,以增强射线特征,从而提升分类器的准确性。

新标题:实时渲染进化!基于射线的三维重建创新方法

双射线可见性分类器的框架结构如图3所示

2.3 Multi-view Consistency Optimization

以设计的主网络ray-surface distance network和辅助网络dual-ray visibility classifier为铺垫,引入多视角一致性优化这一关键模块,对两个网络进行two-stage训练。

(1) 首先为辅助网络dual-ray visibility classifier构造用于训练的射线对。对于一张图片中的一条射线(对应图片中的一个像素),通过其ray-surface distance可知对应的空间表面点,将其投影到训练集中的剩余视角下,即得到另一个射线;而该射线有其对应的ray- surface distance,文章设置阈值10毫米来判断两条射线是否相互可见。

(2) 第二阶段是训练主网络ray-surface distance network使其预测的距离场满足多视角一致性。如图4所示,对于一条主射线及其表面点,以该表面点为球心均匀采样,得到若干条multi-view ray。将主射线与这些multi-view ray一一配对,通过训练好的dual-ray visibility classifier即可得到其相互可见性。再通过ray-surface distance network预测这些射线的ray-surface distance;若主射线与某一条采样射线是相互可见的,那么两条射线的ray-surface distances计算得到的表面点应是同一个点;依此设计了对应的损失函数,并对主网络进行训练,最终可以使ray-surface distance field满足多视角一致性。   

新标题:实时渲染进化!基于射线的三维重建创新方法

2.4 Surface Normal Derivation and Outlier Points Removal

由于在场景表面边缘处的深度值往往存在突变(存在不连续性),而神经网络又是连续函数,上述ray-surface distance field在表面边缘处容易预测出不够准确的距离值,从而导致边缘处的几何表面存在噪声。好在,设计的ray-surface distance field有一个很好的特性,如图5所示,每个估计的三维表面点的法向量都可以通过网络的自动微分以闭合形式轻松求出。因此,可以在网络推理阶段计算表面点的法向量欧氏距离,若该距离值大于阈值,则该表面点被视作离群点并剔除,从而得到干净的三维重建表面。

新标题:实时渲染进化!基于射线的三维重建创新方法

图 5 Surface normal计算

三、Experiments

为了验证所提出方法的有效性,我们在三个数据集上进行了实验。这三个数据集分别是object-level的合成数据集Blender [1]、scene-level合成数据集DM-SR [2]以及scene-level真实数据集ScanNet [3]。我们选择了七个baselines进行性能对比。其中,OF [4]/DeepSDF [5]/NDF [6]/NeuS [7]是基于坐标的level-set方法,DS-NeRF [8]是有depth监督的NeRF-based方法,LFN [9]和PRIF [10]是基于射线的两个baselines

由于RayDF方法的易于直接增加一个radiance分支来学习纹理,因此可以与支持预测radiance field的基准模型进行比较。因此,本论文的对比实验分为两组,第一组(Group 1)仅预测距离(几何),第二组(Group 2)同时预测距离和辐射度(几何和纹理)

3.1 Evaluation on Blender Dataset

从Table 2和图6可以看出,在Group 1和2中,RayDF在表面重建上取得了更优的结果,尤其是在最重要的 ADE 指标上明显优于基于坐标和射线的baselines。同时在radiance field rendering上,RayDF也取得了与DS-NeRF相当的性能,并优于LFN和PRIF。

新标题:实时渲染进化!基于射线的三维重建创新方法

新标题:实时渲染进化!基于射线的三维重建创新方法

图 6 Blender数据集可视化对比

3.2 Evaluation on DM-SR Dataset

从Table 3可以看出,在最关键的 ADE 指标上,RayDF超越了所有baselines。同时,在Group 2的实验中,RayDF能够在获得高质量的新视图合成的同时,保证恢复出准确的表面形状(见图7)。

新标题:实时渲染进化!基于射线的三维重建创新方法

新标题:实时渲染进化!基于射线的三维重建创新方法

图 7 DM-SR数据集可视化对比

3.3 Evaluation on ScanNet Dataset

表4比较了RayDF和baselines在具有挑战性的真实世界场景中的性能。在第一组和第二组中,RayDF在几乎所有评估指标上都明显优于baselines,展现出在恢复复杂的真实世界三维场景方面的明显优势

新标题:实时渲染进化!基于射线的三维重建创新方法

新标题:实时渲染进化!基于射线的三维重建创新方法

以下是图8 ScanNet数据集可视化对比的重写内容:在图8中,我们展示了ScanNet数据集的可视化对比结果

3.4 Ablation Study

在Blender数据集上进行了消融实验,论文中的Table 5展示了对于关键的双光线可见性分类器的消融实验结果

如Table 5 (1)所示,如果没有dual-ray visibility classifier的帮助,ray-surface distance field则会无法对新视角下的射线预测出合理的距离值(见图9)。
在classifier的输入中,选择了输入表面点坐标来作为辅助,如Table 5 (2)和(3)所示,若选择输入表面点距离值作为辅助或是不提供辅助信息,分类器会获得较低的准确率和F1分数,导致为ray-surface distance network提供的可见性信息不够准确,进而预测出错误的距离值。
如Table 5 (4)所示,以非对称的方式输入一对射线,所训练得到的分类器准确率较高,但F1分数较低。这表明,这种分类器的鲁棒性明显低于用对称输入射线训练的分类器。

其他的切除操作可以在论文和论文附录中查看

新标题:实时渲染进化!基于射线的三维重建创新方法

新标题:实时渲染进化!基于射线的三维重建创新方法

需要重新写的内容是: 图9展示了使用分类器和不使用分类器的可视化对比

四、Conclusion

在使用基于射线的多视角一致性框架进行研究时,论文得出了一个结论,即可以通过这种方法高效、准确地学习三维形状表示。论文中使用了简单的射线-表面距离场来表示三维形状的几何图形,并利用新颖的双射线可见性分类器进一步实现了多视角几何一致性。通过在多个数据集上的实验证明,RayDF方法具有极高的渲染效率和出色的性能。欢迎对RayDF框架进行进一步扩展。您可以在主页上查看更多的可视化结果

需要进行改写的内容是:https://vlar-group.github.io/RayDF.html

新标题:实时渲染进化!基于射线的三维重建创新方法

需要进行重新写作的内容是:原文链接:https://mp.weixin.qq.com/s/dsrSHKT4NfgdDPYcKOhcOA

AI新媒体文章 AI新媒体文章

专为新媒体人打造的AI写作工具,提供“选题创作”、“文章重写”、“爆款标题”等功能

AI新媒体文章 75 查看详情 AI新媒体文章

以上就是新标题:实时渲染进化!基于射线的三维重建创新方法的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/452084.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 23:42:42
下一篇 2025年11月7日 23:53:18

相关推荐

  • 推荐有效的工具和技术来进行网站性能优化

    随着互联网的快速发展,越来越多的企业将自己的业务扩展到了网上。然而,随之而来的问题是网站的性能优化。一个高效的网站能够提高用户体验,增加访问量以及销售额。为了达到这些目标,下面将要介绍一些有效的工具和技术来帮助您对网站进行性能优化。 页面压缩:页面压缩是通过减少文件大小来提高页面加载速度的一种方法。…

    2025年12月22日
    200
  • 实现响应式布局的技术和策略

    如何实现响应式布局的技术与方法 引言:随着移动设备的普及和多种终端的涌现,实现响应式布局已成为现代网页开发的重要一环。响应式布局可以使网页在不同的屏幕尺寸下自动适应,提供更好的用户体验。本文将介绍响应式布局的技术与方法,并提供具体的代码示例。 一、媒体查询(Media Queries)媒体查询是实现…

    2025年12月21日
    000
  • 静态重定位技术的原理及其应用案例

    静态重定位技术的原理和应用 引言:在现代计算机系统中,内存管理是一个非常重要的课题。随着软件的复杂性和规模的增加,内存的限制成为了我们面临的一个挑战。为了更高效地利用内存资源,静态重定位技术应运而生。本文将介绍静态重定位技术的原理、应用以及提供一些具体的代码示例。 一、静态重定位技术的原理静态重定位…

    2025年12月21日
    000
  • 分析静态定位技术的优缺点

    静态定位技术的优势与局限性分析 随着现代科技的发展,定位技术已经成为我们生活中不可或缺的一部分。而静态定位技术作为其中的一种,具有其特有的优势和局限性。本文将对静态定位技术进行深入分析,以便更好地了解其应用现状和未来的发展趋势。 首先,我们来看一下静态定位技术的优势所在。静态定位技术是通过对待定位对…

    2025年12月21日
    000
  • 优化网页设计的方法——静态定位的应用技巧

    在现代互联网领域中,网页设计是一个至关重要的领域。深入探究网页设计的方方面面,现代设计师越来越意识到静态定位技术的重要性。静态定位技术可以使得网页设计更灵活,更符合用户的需求,从而大大提高用户对于网页的满意度与使用体验。本文将探究静态定位技术的作用,以及如何在网页设计中去优化与应用静态定位技术。 一…

    2025年12月21日
    000
  • 用Canvas技术打造引人入胜的动态效果,轻松get!

    轻松掌握Canvas技术,打造炫酷动态效果 Canvas是HTML5中一项功能强大的绘图技术,可以实现各种炫酷的动态效果。本文将带你一步步学习Canvas的基本用法,并提供具体的代码示例,让你轻松掌握这项技术。 一、Canvas简介 Canvas是HTML5中的一个元素,用于在网页上绘制图形、动画等…

    2025年12月21日
    000
  • 了解canvas的JS技术:你熟知哪些呢?

    探究canvas的JS技术:你知道有哪些吗? 简介 在现代Web开发中,JavaScript已经成为不可或缺的一部分。作为一种脚本语言,它可以为网页添加交互性和动态性。而在JS技术中,canvas则是一个重要的API之一。本文将带您深入了解canvas的JS技术,并介绍一些常用的canvas相关功能…

    2025年12月21日
    200
  • 再谈前端HTML模板技术

    这篇文章介绍的内容是关于再谈前端HTML模板技术,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 在web2.0之前,写jsp的时候虽然有es和JSTL,但是还是坚持jsp。后面在外包公司为了快速交货,还是用了php Smart技术。 web2.0后,前端模板技术风行。 代表有如下三大…

    2025年12月21日 好文分享
    000
  • 如何在C++中进行机器视觉和图像处理?

    如何在C++中进行机器视觉和图像处理? 机器视觉和图像处理是计算机科学领域中的重要分支,广泛应用于图像识别、目标检测、人脸识别等领域。在C++中,有许多强大的库和工具可以帮助我们实现机器视觉和图像处理的功能。本文将介绍如何利用OpenCV库在C++中进行机器视觉和图像处理,并给出相应的代码示例。 安…

    2025年12月17日
    000
  • 如何实现C++中的机器视觉算法和物体识别?

    如何实现C++中的机器视觉算法和物体识别? 引言:随着人工智能的不断发展和应用,机器视觉技术在各个领域中得到了广泛的应用,比如自动驾驶、安防监控、医学影像等等。其中,C++作为一种广泛使用的编程语言,具备编译效率高、灵活性强等特点,逐渐成为了机器视觉算法实现的首选语言。本文将介绍如何通过C++实现机…

    2025年12月17日
    000
  • XML数据绑定技术有哪些

    XML数据绑定技术通过将XML与程序对象映射,提升开发效率与代码可读性,主要分为基于XSD生成代码(如JAXB)和基于注解运行时绑定(如Simple XML)两类;选择时需权衡Schema稳定性、性能、开发效率及框架成熟度;相比手动解析,其优势在于类型安全、低维护成本,但面临大文件内存开销与复杂结构…

    2025年12月17日
    000
  • Python开发建议:掌握常用的调试工具和技术

    Python作为一种强大、灵活的编程语言,被广泛应用于各种软件开发领域。然而,许多开发者在学习和使用Python时,往往忽略了调试技术的重要性。调试是软件开发过程中不可或缺的一部分,它可以帮助开发者找到和解决代码中的问题,提高开发效率,保证软件质量。因此,掌握常用的调试工具和技术对于Python开发…

    2025年12月13日
    000
  • Python底层技术揭秘:如何实现图像处理

    Python底层技术揭秘:图像处理的实现及代码示例 导语:图像处理是计算机科学中十分重要的一个领域。通过使用Python以及相关的底层技术,我们能够实现各种各样的图像处理操作。在本文中,我们将揭示Python图像处理的底层技术,并提供一些实用的代码示例。 一、Python图像处理的基础知识在开始探讨…

    2025年12月13日
    000
  • Python底层技术揭秘:如何实现哈希算法

    Python底层技术揭秘:如何实现哈希算法,需要具体代码示例 摘要:哈希算法是计算机领域中常用的技术之一,用于快速确定数据的唯一标识。Python作为一门高级语言,提供了许多内建的哈希函数,如hash()函数以及各种散列算法的实现。本文将揭示哈希算法的原理和Python底层实现的细节,并提供具体的代…

    2025年12月13日
    000
  • 苹果发布 Safari 技术预览版 223:聚焦稳定性与性能优化

    近日,苹果公司推出了 safari 技术预览版的最新版本 223,该版本属于其专为开发者和早期用户打造的实验性浏览器更新。本次更新的重点在于修复已知问题并提升性能表现,目的是为未来正式版 safari 浏览器打下更坚实的基础。 自 2016 年首次发布以来,Safari 技术预览版一直是开发者测试 …

    2025年12月2日
    000
  • 改进自动驾驶在不确定环境下的轨迹规划方法

    论文题目:《基于改进的模型预测控制的自动驾驶车辆在不确定环境下的轨迹规划方法》 发表期刊:IEEE Transactions on Intelligent Transportation Systems 发布日期:2023年04月 以下是我自己的論文閱讀筆記,主要是我自己覺得重點的部分,非全文翻譯,該…

    2025年12月2日 科技
    000
  • 实战部署:动态时序网络用于端到端检测和跟踪

    本文经自动驾驶之心公众号授权转载,转载请联系出处。 相信除了少数自研芯片的大厂,绝大多数自动驾驶公司都会使用英伟达NVIDIA芯片,那就离不开TensorRT. TensorRT是在NVIDIA各种GPU硬件平台下运行的一个C++推理框架。我们利用Pytorch、TF或者其他框架训练好的模型,可以首…

    2025年12月2日 科技
    000
  • 制造领域中的人工智能应用

    在制造市场中,机器视觉已经成为许多人工智能应用的重要组成部分。随着人工智能进入制造车间,这些标准变得尤为关键 讯飞智作-虚拟主播 讯飞智作是一款集AI配音、虚拟人视频生成、PPT生成视频、虚拟人定制等多功能的AI音视频生产平台。已广泛应用于媒体、教育、短视频等领域。 6 查看详情 在推动视觉应用的多…

    2025年12月2日
    000
  • 国产屏下 3D 人脸识别技术进入测试阶段 华为还是小米首发?

    7 月 14 日,”数码闲聊站” 消息称,有厂商正在实验室中对国产屏下 3d 人脸识别技术进行版本测试,这表明该技术正逐步迈向成熟,未来有望在智能手机领域实现应用。 近年来,屏下 3D 人脸识别技术成为智能手机设计的重要突破,其目标是将 3D 人脸识别模块完全置于屏幕下方,从…

    2025年12月2日
    100
  • TCL 华星发布电竞 MNT 显示技术,以 “屏宇宙” 生态领跑全球电竞显示赛道

    8 月 1 日,中国 上海]2025 年第二十二届中国国际数码互动娱乐展览会(简称“chinajoy2025”)今日盛大启幕。tcl 华星以“屏定次元 热爱全开”为参展主题,联合三星、联想、华硕、tcl、aoc、飞利浦、iqoo、acer、msi、lg、雷鸟等众多知名合作伙伴惊艳亮相。展会期间,tc…

    2025年12月2日 硬件教程
    200

发表回复

登录后才能评论
关注微信