3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式
AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com

在今天的数字化时代,3d 资产在元宇宙的建构、数字孪生的实现以及虚拟现实和增强现实的应用中扮演着重要角色,促进了技术创新和用户体验的提升。

现有的3D资产生成方法通常利用生成式模型基于空间变化双向反射分布函数(SVBRDF, Spatially Varying Bidirectional Reflectance Distribution Function)在预设光照条件下推断表面位置的材质属性。然而,这些方法很少考虑到人们对身边常见物体的表面材质认知构建出的强大且丰富的先验知识(例如汽车轮胎应为外缘的橡胶胎面包裹着金属轮毂),且忽略了材质应该与物体本身的 RGB 色彩进行解耦。Without changing the original meaning, the existing 3D asset generation methods often utilize generative models based on spatially varying bidirectional reflectance distribution function (SVBRDF) to infer material properties given the surface positions under predefined lighting conditions. However, these methods rarely take into account the strong and rich prior knowledge that people have in constructing the surface materials of common objects around us (such as the fact that car tires should have rubber tread covering metal rims on the outer edge), and they disregard the decoupling between material and the RGB color of objects themselves.

因此,如何将人类对物体表面材质的先验知识有效地融入到材质生成过程中,从而提高现有3D资产的整体质量,成为了当前研究的重要课题。

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

对于这一问题,近日,中国科学院自动化研究所、北京邮电大学及香港理工大学等京港两地的研究团队发布了名为《MaterialSeg3D: Segmenting Dense Materials from 2D Priors for 3D Assets》的论文,构造了首个针对多种类复杂材质物体的 2D 材质分割数据集 MIO,其中包含了多种语义类别下的、单一物体的、各个相机角度的像素级材质标签。该研究提出了一种能够利用 2D 语义先验在 UV 空间中推断出 3D 资产表面材质的材质生成方案 —— MaterialSeg3D。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

论文:https://arxiv.org/pdf/2404.13923

代码地址:https://github.com/PROPHETE-pro/MaterialSeg3D_

项目网站:https://materialseg3d.github.io/3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

3D 建模师通常根据生活常识或真实世界的物体原型来定义资产表面的材质。相比之下,基于生成式模型构建 3D 资产的方法使用 SVBRDF 来推断材质信息,但由于缺乏准确的高质量 3D 资产样本,这些方法难以生成高泛化性和高保真度的物理材质通道信息。此外,这类方法也未能利用公开网站中的海量 Web Image 数据来丰富物体表面材质信息的先验知识。

因此,本文聚焦于如何将 2D 图片中关于材质的先验知识引入解决 3D 资产材质信息定义的任务中。

MIO 数据集

这篇论文首先尝试从现有 3D 资产数据集中提取材质分类的先验知识,但由于数据集样本过少且风格单一,分割模型难以学习到正确的先验知识。

相比 3D 资产,2D 图像则更为广泛地存在于公开网站或数据集上。然而,现有的带注释 2D 图像数据集与 3D 资产渲染图的分布存在较大差距,无法直接提供足够的材质先验知识。

因此,本文构建了一个定制数据集 MIO(Materialized Individual Objects),是目前最大的多类别单一复杂材质资产的 2D 材质分割数据集,包含了从各种相机角度采样的图像,并由专业团队精确注释。

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

                               材质类注释和 PBR 材质球体映射的可视化示例。

在构造该数据集时,本文遵循以下规则: 

每张采样图像中只包含一个突出的前景物体 

收集相似数量的真实场景 2D 图片和 3D 资产渲染图

收集各个相机角度的图像样本,包括顶视图和仰视图等特殊视角

MIO 数据集的独到之处在于,它不仅仅构造了每种材质类别的像素级标签,还单独构建了每个材质类别与 PBR 材质取值间的一一映射关系。这些映射关系是由 9 名专业 3D 建模师经过讨论后确定的。本文从公共材质库收集了超过 1000 个真实的 PBR 材质球作为备选材质,并依据建模师的专业知识进行筛选与指定,最终确定了 14 个材质类别并将其与 PBR 材质的映射关系作为数据集的标注空间。

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

Freepik Mystic Freepik Mystic

Freepik Mystic 是一款革命性的AI图像生成器,可以直接生成全高清图像

Freepik Mystic 127 查看详情 Freepik Mystic

MIO 数据集共包含 23,062 张单个复杂物体的多视角图像,分为 5 个大的元类:家具、汽车、建筑、乐器和植物,具体又可以分为 20 种具体的类别,特别值得一提的是,MIO 数据集中包含大约 4000 张俯视图图像,提供了在现有 2D 数据集中很少出现的独特视角。

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

MaterialSeg3D

有了 MIO 数据集作为可靠的材质信息先验知识来源,这篇论文随后提出了名为 MaterialSeg3D 的全新 3D 资产表面材质预测新范式,为给定的资产表面生成合理的 PBR 材质,从而能够真实地模拟物体的物理特性,包括光照、阴影和反射,使 3D 物体在各种环境下都表现出高度的真实性和一致性,为现有 3D 资产缺乏材质信息的问题提出有效解决方案。

MaterialSeg3D 整个处理流程中包括三个部分:3D 资产的多视图渲染、多视图下的材质预测和 3D 材质 UV 生成。在多视图渲染阶段,确定了俯视图、侧视图和 12 个环绕角度的相机姿势,以及随机的俯仰角度,生成 2D 渲染图像。在材质预测阶段,利用基于 MIO 数据集训练的材质分割模型,对多视角渲染图进行像素级的材质标签预测。在材质 UV 生成阶段,将材质预测结果映射到临时 UV 图上,通过加权投票机制处理得到最终的材质标签 UV,并转化为 PBR 材质贴图。

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

可视化的效果与实验

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

为评估 MaterialSeg3D 的有效性,本文进行了与近期相似工作的定量与定性实验分析,重点关注单图像到 3D 资产的生成方法、纹理生成以及公共 3D 资产三个方面。对于单图像到 3D 资产的生成方法,与 Wonder3D、TripoSR 和 OpenLRM 进行了比较,这些方法将资产的某一参照视图作为输入,直接生成具有纹理特征的 3D 对象。通过可视化图片观察到,MaterialSeg3D 处理后的资产在渲染的真实性方面相较之前的工作有显著改善。论文还比较了现有的纹理生成方法,如 Fantasia3D、Text2Tex 以及 Meshy 网站提供的在线功能,这些方法可以根据文本提示信息生成纹理结果。

在此基础上,MaterialSeg3D 在不同的光照条件下能够生成精确的 PBR 材质信息,使渲染效果更加真实。

定量实验采用 CLIP Similarity、PSNR、SSIM 作为评价指标,选择 Objaverse-1.0 数据集中的资产作为测试样本,并随机选择三个相机角度作为新视图。

3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式

这些实验证明了 MaterialSeg3D 的有效性。其能够生成公共 3D 资产缺失的 PBR 材质信息,为建模师和后续的研究工作提供更多优质资产。

总结与展望

这篇论文针对 3D 资产表面材质生成问题进行了探索,构建了定制的 2D 材质分割数据集 MIO。在这一可靠数据集的支持下,提出了新的 3D 资产表面材质生成范式 MaterialSeg3D,能够为单个 3D 资产生成可解耦的独立 PBR 材质信息,显著增强了现有 3D 资产在不同光照条件下的渲染真实性和合理性。

作者指出,未来的研究将专注于扩展数据集中物体元类的数量、通过生成伪标签扩大数据集规模以及对材质分割模型进行自训练,以便该生成范式能够直接应用于绝大多数种类的 3D 资产。

以上就是3D资产生成领域福音:自动化所、北邮团队联合打造材质生成新范式的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/794993.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月26日 15:38:37
下一篇 2025年11月26日 15:42:45

相关推荐

  • Yii框架的CVE漏洞修复与版本升级

    yii框架的cve漏洞可以通过应用补丁或升级版本来修复。具体步骤包括:1. 监控yii官方博客和github仓库的安全公告。2. 及时应用针对特定cve的补丁。3. 考虑升级到包含cve修复的新版本,升级前在测试环境中备份和测试。4. 升级后进行全面功能测试,确保cve已修复。5. 检查和管理第三方…

    2025年12月5日
    200
  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • JS怎么实现平滑页面锚点跳转 4种锚点跳转技巧让页面滚动更优雅

    页面锚点跳转平滑滚动可通过多种方法实现。1. 使用scrollintoview方法,通过设置behavior: ‘smooth’实现简单平滑滚动;2. 利用scrollto方法控制滚动位置并设置行为为平滑;3. 自定义动画函数实现更个性化效果,包含缓动函数控制速度变化;4. …

    2025年12月5日 web前端
    000
  • Google My Business API:PHP客户端正确使用readMask获取地点列表

    本教程旨在解决使用Google My Business Business Information API PHP客户端获取地点列表时,因readMask参数格式不正确导致的INVALID_ARGUMENT错误。文章将详细解释readMask字段的正确用法,指出其应指定地点资源的有效属性,而非用户或照…

    2025年12月5日
    100
  • JavaScript数字格式化中意外空格问题的解决方案

    本文旨在解决JavaScript中处理用户输入时,因意外的空白字符导致数字格式化功能出现异常的问题。通过引入String.prototype.trim()方法,我们能够有效地清除输入字符串首尾的空白,确保Intl.NumberFormat等格式化工具能正确处理纯数字内容,从而提升数据处理的准确性和用…

    2025年12月5日
    000
  • 怎么新建Python文件VSCode_VSCode创建Python文件教程

    答案:在VS Code中新建Python文件需打开软件后创建新文件并保存为.py格式,系统将自动启用Python语言服务。可通过快捷键Ctrl+N(Cmd+N)新建文件,再用Ctrl+S(Cmd+S)保存为.py文件以激活语法高亮和代码补全功能;也可通过菜单栏或资源管理器新建文件。为确保正常运行,需…

    2025年12月5日
    000
  • Composer如何处理fork的包_使用自定义分支代码库

    Composer优先使用fork包需在repositories中先声明fork的VCS地址,并在require中指定dev-分支名,确保顺序和分支明确,修改后运行composer update即可同步代码。 Composer如何处理fork的包?简单来说,Composer允许你使用fork的包,甚至…

    2025年12月5日
    000
  • 如何在Laravel中实现权限管理

    1.spatie/laravel-permission包提供rbac与pbac混合模型,支持角色权限分配、权限检查及与laravel gates/policies无缝集成;2.结合laravel policies可实现基于模型实例的细粒度控制,如限制用户仅能编辑自己的文章;3.blade模板中使用@…

    2025年12月5日
    000
  • DevDocs— 开源的技术文档爬取和处理工具

    devdocs:程序员和ai开发者的效率利器 DevDocs是一款开源的技术文档爬取与处理工具,专为程序员和AI开发者打造。它利用智能爬虫技术,高效地收集和整理技术文档,将原本需要数周才能完成的任务缩短至数小时。DevDocs支持多线程爬取,速度快,并能自动识别和处理网站链接,支持1-5层深度爬取。…

    2025年12月5日
    000
  • packagist和composer是什么关系_Packagist作为Composer默认仓库的角色解读

    Composer是PHP依赖管理工具,通过composer.json声明依赖并安装;Packagist是其默认包仓库,提供公开库的索引与分发;两者协同工作,支持自定义源和私有仓库配置,实现高效、灵活的项目依赖管理。 如果您在使用PHP进行开发,并希望高效地管理项目依赖,可能会遇到Packagist和…

    2025年12月5日
    000
  • 如何在Laravel中执行数据库迁移

    laravel数据库迁移通过php代码管理数据库结构变更,提供版本控制功能。1. 创建迁移文件:使用artisan命令生成带时间戳的迁移文件并定义up()和down()方法;2. 执行迁移:运行migrate命令按顺序执行未应用的迁移;3. 回滚迁移:使用rollback撤销最近一次迁移,refre…

    2025年12月5日
    000
  • Composer如何降级一个包的版本_回滚到旧版依赖的操作方法

    要回滚Composer包版本,需修改composer.json中对应包的版本约束,执行composer update vendor/package进行降级。直接修改可能因依赖冲突失败,因Composer需确保整体依赖兼容。常见问题包括API不兼容、配置变更、传递性依赖冲突及缓存问题,可用compos…

    2025年12月5日
    000
  • Composer如何管理项目根目录外的依赖_多项目共享本地包的方法

    通过配置composer.json的path类型仓库,Composer可管理项目根目录外的依赖,实现多项目共享本地包。具体做法是将共享代码作为独立包放在外部目录并编写composer.json,然后在主项目中通过repositories指定其路径,再使用require引入。安装时默认创建符号链接(s…

    2025年12月5日
    000
  • Composer如何安装依赖_项目依赖包添加与安装指南

    Composer是PHP依赖管理工具,通过composer.json定义依赖,执行composer install安装库并生成vendor目录和composer.lock锁定版本,确保团队环境一致;使用composer update更新依赖,可指定包名;冲突时可升级依赖、调整版本约束或使用diagn…

    2025年12月5日
    000
  • Java中Spock的用法 详解测试框架

    spock是一个针对java和groovy应用程序的测试框架,其核心优势在于简洁性、强大功能与易读语法,尤其适合行为驱动开发(bdd)。1. spock通过groovy语言的动态特性提升测试代码的表现力;2. 它整合了junit、mockito、hamcrest等工具的优点,简化测试流程;3. 核心…

    2025年12月5日 java
    300
  • js怎样检测设备海拔高度 5种高度检测方案获取位置信息

    1.geolocation api可能不提供海拔数据;2.可结合第三方服务提高精度;3.部分设备支持气压传感器;4.地图api可辅助获取海拔。javascript检测设备海拔需依赖navigator.geolocation提取altitude属性但并非所有设备支持,此时可借助google maps …

    2025年12月5日 web前端
    000
  • JavaScript金额格式化中多余空格的处理与预防

    本文旨在解决JavaScript函数在处理用户输入的逗号分隔字符串时,可能因多余空格导致格式化输出不准确的问题。我们将探讨导致这些空格出现的原因,并提供使用String.prototype.trim()方法来有效清除输入字符串中首尾空白字符的解决方案,确保数据处理的准确性和输出的整洁性。 在开发we…

    2025年12月5日
    000
  • Composer提示Package not found如何解决_常见包找不到错误排查

    Composer提示“Package not found”通常因包名错误、版本不匹配、缓存问题、网络阻塞或仓库配置不当。首先检查composer.json中包名与版本是否正确,确认无误后清除缓存(composer clear-cache),再尝试重新安装;若仍失败,可删除vendor目录和compo…

    2025年12月5日
    000
  • Composer如何配置GitHub token_解决API速率限制问题

    配置GitHub Token可解决Composer因API速率限制导致的安装问题,通过生成具备repo和read:packages权限的Token并全局或项目级配置,提升访问频率;若仍受限,可能因权限不足、IP共享、滥用或泄露所致,可通过使用镜像源、启用缓存、减少依赖等方式进一步优化,验证时可用cu…

    2025年12月5日
    000
  • win11怎么在任务栏显示秒_Win11任务栏时钟显示秒数设置方法

    1、可通过设置、注册表、命令行或第三方工具在Windows 11任务栏时钟显示秒数;2、设置中开启最安全,注册表修改适用于所有版本,命令行更高效,第三方工具提供个性化选项。 如果您希望在Windows 11的任务栏时钟中精确查看当前时间的秒数,可以通过系统设置、注册表编辑或第三方工具实现。此功能有助…

    2025年12月5日
    000

发表回复

登录后才能评论
关注微信