北大出品:纹理质量和多视角一致性的最新SOTA,在2分钟内实现1张图的3D转换

只需两分钟,玩转图片转3d!

还是高纹理质量、多视角高一致性的那种。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

不管是什么物种,输入时的单视图图像还是这样婶儿的:

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

两分钟后,3D版大功告成:

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△上,Repaint123(NeRF);下,Repaint123(GS)

新方法名为Repaint123,核心思想是将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力相结合,来生成高质量、多视角一致的图像。

此外,该研究还引入了针对重叠区域的可见性感知自适应再绘强度的方法。

Repaint123一举解决了此前方法多视角偏差大、纹理退化、生成慢等问题。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

目前项目代码还未在GitHub公布,就有100+人赶来标星码住:

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

Repaint123长啥样?

之前,将图像转换为3D的方法通常采用Score Distillation Sampling (SDS)。尽管该方法的结果令人印象深刻,但存在一些问题,如多视角不一致、过度饱和、过度平滑的纹理以及生成速度缓慢。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△从上至下:输入,Zero123-XL,Magic123,Dream gaussian

为了解决这些问题,来自北京大学、鹏城实验室、新加坡国立大学、武汉大学的研究人员提出了Repaint123。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

总的来说,Repaint123有这几点贡献:

(1)Repaint123通过综合考虑图像到3D生成的可控重绘过程,能够生成高质量的图片序列,并确保这些图片在多个视角下保持一致。

(2)Repaint123提出了一个简单的单视图3D生成的基准方法。

在粗模阶段,它利用Zero123作为3D先验,并结合SDS损失函数,通过优化Gaussian Splatting几何,快速生成粗糙的3D模型(仅需1分钟)。

在细模阶段,它采用Stable Diffusion作为2D先验,并结合均方误差(MSE)损失函数,通过快速细化网格纹理,生成高质量的3D模型(同样只需1分钟)。

(3)大量的实验证明了Repaint123方法的有效性。它能够在短短2分钟内,从单张图像中生成与2D生成质量相匹配的高质量3D内容。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△实现3D一致且高质量的单视角3D快速生成

下面来看具体方法。

Repaint123专注于优化mesh细化阶段,其主要改进方向涵盖两个方面:生成具有多视角一致性的高质量图像序列以及实现快速而高质量的3D重建。

1、生成具有多视角一致性的高质量图像序列

生成具有多视角一致性的高质量图像序列分为以下三个部分:

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△多视角一致的图像生成流程

DDIM反演

卡拉OK视频制作 卡拉OK视频制作

卡拉OK视频制作,在几分钟内制作出你的卡拉OK视频

卡拉OK视频制作 178 查看详情 卡拉OK视频制作

为了保留在粗模阶段生成的3D一致的低频纹理信息,作者采用了DDIM反演将图像反演到确定的潜在空间,为后续的去噪过程奠定基础,生成忠实一致的图像。

可控去噪

为了在去噪阶段控制几何一致性和长程纹理一致性,作者引入了ControlNet,使用粗模渲染的深度图作为几何先验,同时注入参考图的Attention特征进行纹理迁移。

此外,为了执行无分类器引导以提升图像质量,论文使用CLIP将参考图编码为图像提示,用于指导去噪网络。

重绘

渐进式重绘遮挡和重叠部分为了确保图像序列中相邻图像的重叠区域在像素级别对齐,作者采用了渐进式局部重绘的策略。

在保持重叠区域不变的同时,生成和谐一致的相邻区域,并从参考视角逐步延伸到360°。

然而,如下图所示,作者发现重叠区域同样需要进行细化,因为在正视时之前斜视的区域的可视分辨率变大,需要补充更多的高频信息。

另外,细化强度等于1-cosθ*,其中θ*为之前所有相机视角与所视表面法向量夹角θ的最大值,从而自适应地重绘重叠区域。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△相机视角与细化强度的关系

为了选择适当的细化强度,以在提高质量的同时保证忠实度,作者借鉴了投影定理和图像超分的思想,提出了一种简单而直接的可见性感知的重绘策略来细化重叠区域。

2、快速且高质量的3D重建

正如下图所展示的,作者在进行快速且高质量的3D重建过程中,采用了两阶段方法。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△Repaint123两阶段单视角3D生成框架

首先,他们利用Gaussian Splatting表示来快速生成合理的几何结构和粗糙的纹理。

同时,借助之前生成的多视角一致的高质量图像序列,作者能够使用简单的均方误差(MSE)损失进行快速的3D纹理重建。

一致性、质量和速度最优

研究人员对多个单视图生成任务的方法进行了比较。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

△单视图3D生成可视化比较

在RealFusion15和Test-alpha数据集上,Repaint123取得了在一致性、质量和速度三个方面最领先的效果。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

同时,作者也对论文使用的每个模块的有效性以及视角转动增量进行了消融实验:

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

并且发现,视角间隔为60度时,性能达到峰值,但视角间隔过大会减少重叠区域,增加多面问题的可能性,所以40度可作为最佳视角间隔。

1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品

论文地址:https://arxiv.org/pdf/2312.13271.pdf
代码地址:https://pku-yuangroup.github.io/repaint123/
项目地址:https://pku-yuangroup.github.io/repaint123/

以上就是北大出品:纹理质量和多视角一致性的最新SOTA,在2分钟内实现1张图的3D转换的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/444399.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 20:09:30
下一篇 2025年11月7日 20:10:13

相关推荐

  • CSS 响应式图像属性优化技巧:max-width 和 object-fit

    CSS 响应式图像属性优化技巧:max-width 和 object-fit 在设计响应式网页时,优化图像是至关重要的一环。图像的处理不仅影响页面的加载速度,还会影响用户体验。在传统的网页开发中,经常会使用 max-width 属性来实现图像的响应式调整,但这往往会导致图像变形或者失真。而近年来引入…

    2025年12月24日
    000
  • CSS 图像替换属性详解:background-image 和 alt

    CSS 图像替换属性详解:background-image 和 alt 在网页设计中,图像是十分重要的元素之一。为了使图像在网页中能够正确显示,并且提供适当的替代文本,CSS 提供了两个重要的属性:background-image 和 alt。在本文中,我们将详细介绍这两个属性,并提供具体的代码示例…

    2025年12月24日
    000
  • css3中让图像居中可以使用哪个元素

    css3中让图像居中可以使用【align-items:center】元素和【justify-content:center】元素。align-items属性定义flex子项在flex容器的当前行的纵轴方向上的对齐方式。 方法: 采用 align-items:center(垂直居中)和justify-c…

    2025年12月24日
    000
  • 如何在HTML中允许跨域使用图像和画布?

    为了允许跨域使用图像和画布,服务器必须在其HTTP响应中包含适当的CORS(跨域资源共享)头。这些头可以设置为允许特定的来源或方法,或者允许任何来源访问资源。 HTML Canvas An HTML5 Canvas is a rectangular area on a web page that i…

    2025年12月21日
    000
  • 在HTML元素中如何嵌入图像

    这次给大家带来在html元素中如何嵌入图像,在html元素中嵌入图像的注意事项有哪些,下面就是实战案例,一起来看一下。 1 在超链接里嵌入图像 img元素的一个常见用法是结合a元素创建一个基于图像的超链接,代码如下: @@##@@ 浏览器显示这张图片的方式没有什么不同。因此,重要的一点事要向用户提供…

    好文分享 2025年12月21日
    000
  • html中标签之关于创建图像映射详解

    初级前端一枚  下面代码是在图片上创建图像映射  自己整理了下 做个笔记 希望也可以帮助后来学习的朋友! 该段代码中的shape指的是点击区域的形状,coords指的应该是链接区域在图片中的坐标(像素为单位)。 shape1、rect    矩形       2、circle   圆形      3…

    好文分享 2025年12月21日
    000
  • html中如何嵌入图像的实例分析

    img元素允许我们在html文档里嵌入图像。 要嵌入一张图像需要使用src和alt属性,代码如下: @@##@@ 显示效果: 1 在超链接里嵌入图像 立即学习“前端免费学习笔记(深入)”; img元素的一个常见用法是结合a元素创建一个基于图像的超链接,代码如下: @@##@@ 浏览器显示这张图片的方…

    2025年12月21日 好文分享
    000
  • html中如何实现使用图像来代替提交按钮的示例

    1. 用图像代替提交按钮      当只有一个提交按钮的时候 ,可以简单的实现,不用添加事件函数,代码是:  除了标签改为input type = “image”以外,其他的属性和标签的属性是一样的。 2.用图片代替所有的表单按钮 代替submit按钮的图片格式是 立即学习“前端免费学习…

    好文分享 2025年12月21日
    100
  • Matplotlib保存图像的方法是什么

    Matplotlib保存图像的方法是使用savefig()函数。savefig()函数可以将当前绘图窗口中的内容保存为图像文件,支持多种常见的图像格式,如PNG、JPEG、SVG等。 本教程操作系统:windows10系统、Python3.11.4版本、Dell G3电脑。 在Matplotlib中…

    2025年12月13日
    000
  • 生成任何图像的点状文本的Python脚本

    在数字时代,操纵图像和创造艺术效果已成为一种常见的做法。一种有趣的效果是从图像生成点状文本。此过程涉及将图像的像素转换为点图案,从而创建有趣的文本视觉表示。 在这篇博文中,我们将探索如何创建一个可以从任何给定图像生成点线文本的 Python 脚本。通过利用 Python 的强大功能和一些重要的库,我…

    2025年12月13日
    000
  • 豪威年底量产 50MP 图像传感器 0.61 微米像素尺寸低光清晰无伪影

    豪威集团近日宣布推出新型图像传感器 ov50m40,预计 2024 年第四季度量产。这款 0.61 微米像素尺寸的 cmos 传感器拥有 5000 万像素,整合了智能手机前摄、广角、超广角和长焦技术,功能全面。豪威集团高级产品市场经理 james liu 表示,随着智能手机市场对小尺寸高分辨率图像传…

    2025年12月5日
    000
  • StableDiffusion怎样用LoRA定制画风_StableDiffusion用LoRA定制画风【画风定制】

    通过加载LoRA模型可精准控制Stable Diffusion的生成画风,需将.safetensors文件放入models/loras/目录并重启WebUI;2. 在提示词中使用调用,结合正向提示词描述风格、反向提示词排除干扰,并调整权重值(0.5~1.0)优化效果;3. 可引入Textual In…

    2025年12月2日 科技
    100
  • MVDiffusion:实现高质量多视角图像生成与精确复刻场景材质

    逼真的图像生成在虚拟现实、增强现实、视频游戏和电影制作等领域有广泛应用。 随着近两年来扩散模型的快速发展,图像生成领域取得了重大突破。从Stable Diffusion衍生出的一系列根据文本描述生成图像的开源或商业模型,已经对设计、游戏等领域产生了巨大的影响 然而,如何根据给定的文本或其他条件,产生…

    2025年12月2日 科技
    000
  • ICCV’23论文颁奖“神仙打架”!Meta分割一切和ControlNet共同入选,还有一篇让评委们很惊讶

    在法国巴黎举行的计算机视觉顶峰大会iccv 2023刚刚结束! 今年的最佳论文奖,简直是“神仙打架”。 例如,获得最佳论文奖的两篇论文中,就包括颠覆文生图AI领域的著作——ControlNet。 自从开源以来,ControlNet在GitHub上已经获得了24k个星。无论是对于扩散模型还是整个计算机…

    2025年12月2日 科技
    000
  • ICCV 2023揭晓:ControlNet、SAM等热门论文斩获奖项

    在法国巴黎举行了国际计算机视觉大会ICCV(International Conference on Computer Vision)本周开幕 作为全球计算机视觉领域顶级的学术会议,ICCV 每两年召开一次。 ICCV的热度一直以来都与CVPR不相上下,屡创新高 在今天的开幕式上,ICCV官方公布了今…

    2025年12月2日 科技
    000
  • ICCV 2023宣布ControlNet和「分割一切」等热门论文获奖

    本周,国际计算机视觉大会 ICCV(International Conference on Computer Vision)在法国巴黎开幕。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 作为全球计算机视觉领域顶级的学术会议,ICCV 每两…

    2025年12月2日 科技
    000
  • AI 图像放大技术的领导者:Upscayl

    在数字时代,图像无处不在。无论是在社交媒体上分享照片,还是在商业领域中进行品牌宣传,我们都希望能够呈现出清晰、精美的图像。然而,有时候我们只能获得低分辨率的图像,这让我们感到困惑和失望。但是,现在有一个令人兴奋的解决方案——Upscayl,这是一项引领 AI 图像放大技术的在线工具 ☞☞☞AI 智能…

    2025年12月2日 科技
    200
  • 哩布哩布ai安全访问官网地址_哩布哩布ai平台链接官方首页

    哩布哩布AI安全访问官网地址是https://www.liblib.art/,该平台提供丰富的AI模型资源、在线图像生成功能及个性化LoRA训练服务,支持多种模型类型筛选与云端作品管理。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 哩布哩…

    2025年12月2日 科技
    000
  • 哩布哩布AI怎么加速生成速度_哩布哩布AI排队优化与GPU设置技巧

    优先切换高优先级队列并选择空闲GPU节点,调整分辨率至768×768、采样步数20-30,关闭多余插件,利用早晚低峰时段生成以提升效率。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您在使用哩布哩布AI生成图像时遇到排队时间…

    2025年12月2日 科技
    000
  • 即梦AI怎么控制人物姿势 即梦AI精准控制角色动作方法【攻略】

    使用明确提示词、骨骼映射、预设模板、ControlNet插件及草图功能可精准控制即梦AI角色姿态。1、输入具体动作与身体部位描述,提升识别精度;2、开启姿态控制并上传参考图提取骨架,调整关键点与强度;3、选用“舞蹈”“战斗”等分类下的预设模板编号快速调用标准动作;4、安装ControlNet插件,加…

    2025年12月2日 科技
    000

发表回复

登录后才能评论
关注微信