抛弃编码器-解码器架构，用扩散模型做边缘检测效果更好，国防科大提出DiffusionEdge

程序猿 • 2025年11月7日 12:11:41 • 用户投稿 • 阅读 1

当前的深度边缘检测网络通常采用编码器-解码器架构，其中包含上下采样模块，以更好地提取多层次的特征。然而，这种结构限制了网络输出准确且细致的边缘检测结果。

针对这一问题，一篇 AAAI 2024 上的论文给出了新的解决方案。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

论文题目：DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection作者：叶云帆（国防科技大学），徐凯（国防科技大学），黄雨行（国防科技大学），易任娇（国防科技大学），蔡志平（国防科技大学）论文链接: https://arxiv.org/abs/2401.02032开源代码: https://github.com/GuHuangAI/DiffusionEdge

国防科技大学iGRAPE Lab提出了一种新的方法，用于二维边缘检测任务。该方法利用扩散概率模型，在学习迭代的去噪过程中生成边缘结果图。为了减少计算资源的消耗，该方法采用隐空间训练网络，并引入了不确定性蒸馏模块以优化性能。同时，该方法还采用解耦架构加速去噪过程，并引入自适应傅立叶滤波器来调整特征。通过这些设计，该方法能够用有限的资源进行稳定训练，并以更少的增强策略预测出清晰准确的边缘图。实验结果表明，该方法在四个公共基准数据集上的准确度和精度方面均显著优于其他方法。

图 1 基于扩散概率模型的边缘检测过程与优势示例

本文的创新点包括：

提出了针对边缘检测任务的扩散模型DiffusionEdge，该模型无需后处理即可预测出更细、更准确的边缘图。

为了解决扩散模型应用时的难点，我们设计了多种技术来确保方法在隐空间中稳定学习。同时，我们还保留了像素级的不确定性先验知识，并自适应地过滤傅立叶空间中的隐特征。

3、在四个边缘检测公共基准数据集上开展的大量对比实验展示了 DiffusionEdge 在准确度和细度方面均具有卓越的性能优势。

方法描述

本文所提出的 DiffusionEdge 方法总体框架如图 2 所示。受以往工作的启发，该方法在隐空间中训练具有解耦结构的扩散模型，并将图像作为额外的条件线索输入。该方法引入了自适应傅里叶滤波器来进行频率解析，且为了保留来自多个标注者的像素级不确定性信息并减少对计算资源的要求，还以蒸馏的方式直接使用交叉熵损失优化隐空间。

图 2 DiffusionEdge 的整体结构示意

针对目前的扩散模型受到采样步数太多，推理时间太长等问题的困扰，本方法受 DDM [10] 的启发，同样使用解耦的扩散模型架构来加速采样推理过程。其中，解耦的前向扩散过程由显式的转移概率和标准 Wiener 过程的组合来控制：

其中和分别代表初始边缘和噪声边缘，指的是反向边缘梯度的显式转换函数。与 DDM 类似，本文方法默认使用常量函数，则其相应的逆过程可以被表示为：

其中。为了训练解耦的扩散模型，该方法需要同时监督数据和噪声分量，因此，训练目标可以被参数化为：

其中是去噪网络中的参数。由于扩散模型如果要在原始图像空间中训练的话会占用太多的计算成本，因此参考 [11] 的思路，本文提出的方法将训练过程转移到了具有 4 倍下采样空间大小的隐空间中。

如图 2 所示，该方法首先训练了一对自编码器和解码器的网络，该编码器将边缘标注压缩为一个隐变量，而解码器则用于从这个隐变量中恢复出原来的边缘标注。如此一来，在训练基于 U-Net 结构的去噪网络阶段，该方法便固定这一对自编码和解码器网络的权重，并在隐空间中训练去噪过程，这样可以大幅减少网络对计算资源的消耗，同时维持不错的性能。

为了提升网络最后的性能，本文提出的方法在解耦操作中引入了一种可以自适应地过滤掉不同频率特征的模块。如图 2 左下角所示，该方法将自适应的快速傅立叶变换滤波器（Adaptive FFT-filter）集成到了去噪 Unet 网络中，位置在解耦操作之前，以在频域中自适应过滤并分离出边缘图和噪声分量。具体来说，给定编码器特征，该方法首先沿空间维度执行二维的傅里叶变换（FFT），并将变换后的特征表示为。紧接着，为了训练这个自适应频谱滤波模块，构造了一个可学习的权重图并将其W乘以Fc。频谱滤波器可以全局地调整特定频率，并且学习到的权重可以适应不同数据集目标分布的不同频率情况。通过自适应地滤除无用成分，本方法通过快速傅里叶逆变换（IFFT）操作将特征从频域映射回空间域。最后，通过额外引入了来自的残差连接，避免完全过滤掉了所有有用的信息。上述过程可以由以下公式来描述：

其中是输出特征，o表示哈达玛积（Hadamard Product）。

由于边缘和非边缘像素的数量高度不平衡（大多数像素都是非边缘的背景），参考以往的工作，我们同样引入不确定性感知的损失函数进行训练。具体来说，将作为第i个像素的真值边缘概率，对于第j个边缘图中的第i个像素，其值为，则不确定性感知 WCE 损失的计算方式如下：

其中,其中是决定真值标注中不确定的边缘像素的阈值，如果像素值大于 0 而小于此阈值，则此类模糊的，置信度不够高的像素样本将在后续的优化过程中被忽略（损失函数为 0）。和分别表示真值标注边缘图中边缘和非边缘像素的数量。是用来平衡和的权重（设为 1.1）。因此，每个边缘图的最终损失函数计算方式为。

在优化过程中忽略模糊的低置信度的像素可以避免网络混乱，使训练过程更稳定的收敛，并提高模型的表现。然而，将二元交叉熵损失直接应用于在数值和空间上均未对齐的隐空间中是几乎不可能的。尤其是，不确定性感知的交叉熵损失中利用阈值（一般从 0 到 1）来判断像素是否为边缘，这是从图像空间上定义的，而隐变量遵循正态分布并且具有完全不同的范围和实际意义。此外，像素级的不确定性很难与不同大小的编码和下采样的隐特征保持一致，二者是很难直接兼容的。因此，将交叉熵损失直接应用于优化隐变量不可避免地会导致不正确的不确定性感知。

另一方面，人们可以选择将隐变量解码回图像级别，从而可以直接使用不确定性感知交叉熵损失来直接监督预测出的边缘结果图。不幸的是，这种实现让反向传播的参数梯度通过了冗余的自编码器网络，使得梯度很难得到有效的传递。此外，自编码器网络中额外的梯度计算会带来巨大的 GPU 内存消耗成本，这违背了本方法设计一个实用的边缘检测器的初衷，很难推广到实际应用中。因此，本方法提出了不确定性蒸馏损失，可以直接优化隐空间上的梯度，具体来说，设重构出的隐变量为，自编码器网络的解码器是D，解码出的边缘结果是eD，本方法考虑基于链式法则直接计算不确定性感知的二元交叉熵损失的梯度，具体计算方式为：

为了消除自编码器网络的负面影响，本方法直接跳过了自编码器传递梯度并将梯度的计算方式修改调整为：

这样的实现方式大大降低了计算成本，并允许利用不确定性感知的损失函数直接在隐变量上优化。如此一来，再结合一个随步数t自适应变化的时变损失权重，本方法最终训练优化目标可以被表示为：

实验结果

本方法在四个领域内被广泛使用的边缘检测公共标准数据集上进行了实验：BSDS、NYUDv2、Multicue 和 BIPED。由于边缘检测数据标注比较难，标注数据量都比较少，以往的方法通常会使用各种策略来增强数据集。例如说，BSDS 中的图像通过水平翻转 (2×)、缩放 (3×) 和旋转 (16×) 进行增强，能够生成比原始版本扩大了 96 倍的训练集。以往的方法在其他数据集上使用的通用增强策略总结在了表格 1 中，其中 F 代表水平翻转，S 代表缩放，R 代表旋转，C 代表裁剪，G 代表伽马校正。不同的是，本方法仅需要使用随机裁剪的 320320 的图像块来训练所有数据。在 BSDS 数据集中，本方法则仅仅采用随机的翻转和缩放，其定量对比结果展示在了表 2 中。在 NYUDv2、Mu lticue 和 BIPED 数据集中，该方法仅需采用随机翻转训练。在使用更少增强策略的情况下，本方法在各个数据集，各个指标上的表现都优于之前的方法。通过观察图 3-5 的预测结果可以看出，DiffusionEdge 能够学习并预测出跟 gt 分布几乎一样的边缘检测结果图来，预测结果准确而清晰的优势对于有精细化需求的下游任务来说非常重要，也展示了其能直接应用于后续任务的巨大潜力。

表 1 以往方法在四个边缘检测数据集上使用的增强策略

表 2 不同方法在 BSDS 数据集上的定量对比

图 3 不同方法在 BSDS 数据集上的定性对比

图 4 不同方法在 NYUDv2 数据集上的定性对比

图 5 不同方法在 BIPED 数据集上的定性对比

以上就是抛弃编码器-解码器架构，用扩散模型做边缘检测效果更好，国防科大提出DiffusionEdge的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/427093.html

ai 训练

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

华为 Mate 72 Pro网络延迟_华为 Mate 72 Pro 信号增强方法

上一篇 2025年11月7日 12:11:40

Mysql5.7.11在windows10上的安装与配置(解压版)_MySQL

下一篇 2025年11月7日 12:11:46

用户投稿

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
6000
用户投稿

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
11001
用户投稿

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
13000
用户投稿

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
用户投稿

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
13000
用户投稿

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
12000
用户投稿

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
10000
用户投稿

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
5000
用户投稿

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
用户投稿

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
用户投稿

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
用户投稿

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
用户投稿

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000
用户投稿

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
0000
用户投稿

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
0000
用户投稿

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
0000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 用户投稿
2000
用户投稿

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
9000
用户投稿

如何用 CSS Paint API 实现倾斜的斑马线间隔圆环？

实现斑马线边框样式：探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。问题：给定一个有多个圆圈组成的斑马线图案，如何使用 css 实现倾斜的斑马线间隔圆环？答案：立即学习“前端免费学习笔记（深入）”；使用 css paint api…

程序猿
2025年12月24日
0000
用户投稿

如何使用CSS Paint API实现倾斜斑马线间隔圆环边框？

css实现斑马线边框样式想定制一个带有倾斜斑马线间隔圆环的边框？现在使用css paint api，定制任何样式都轻而易举。 css paint api 这是一个新的css特性，允许开发人员创建自定义形状和图案，其中包括斑马线样式。立即学习“前端免费学习笔记（深入）”；实现倾斜斑马线间隔圆环 …

程序猿
2025年12月24日
1000