【图像去噪】第六期论文复现赛——MIRNet

程序猿 • 2025年11月10日 09:35:18 • 科技 • 阅读 0

本文复现MIRNet系列论文，含V1和V2版本。V1先提取低级特征，经递归残差组处理，再得残差图像，最终恢复图像；V2类似但优化模块提升速度。复现精度达标，提供数据集、预训练模型、文件结构及训练、评估等操作方法，方便使用。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

MIRNet 系列论文复现兼飞桨特色模型挑战赛

复现了两篇论文：

MIRNetV1: Learning Enriched Features for Real Image Restoration and Enhancement

MIRNetV2: Learning Enriched Features for Fast Image Restoration and Enhancement

官方源码：https://github.com/swz30/MIRNet 和 https://github.com/swz30/MIRNetV2

复现地址：https://github.com/sldyns/MIRNetV2_paddle

1. 简介

MIRNet V1:

给定一个图像 I∈RH×H×3I∈RH×H×3，MIRNet 首先应用一个卷积层来提取低级特征 X0∈RH×W×CX0∈RH×W×C. 接下来，特征映射 X0X0 通过 NN 个递归残差组(RRGs)，产生深度特征 Xd∈RH×W×CXd∈RH×W×C. 我们注意到每个 RRG 包含多个多尺度残差块(MRB)，MRB 由多个（本文中有三个）并行连接的全卷积流组成，每个连接上先由 DAU 抑制了不太有用的特性，并且只允许信息更丰富的特性进一步传递给 SKFF，SKFF 模块通过 Fuse 和 select 两种操作对接受域进行动态调整. 接下来，应用卷积层，得到残差图像 R∈RH×H×3R∈RH×H×3。最后，恢复的图像为 I^=I+RI^=I+R.

MIRNet V2:

MIRNetV2 过程同 MIRNet V1 类似，主要在 MRB 内减少了卷积流间的链接，同时将DAU替换为残差上下文块，显著降低了模型大小并提升了推理速度.

2. 复现精度

MIRNet V1:

验收标准：SIDD PSNR: 39.678

复现结果：SIDD PSNR: 39.687

飞桨特色模型挑战赛：

验收标准：SIDD PSNR: 37，SSIM: 0.94

MIRNet V2，训练92个epoch精度：SIDD PSNR: 39.5286，SSIM: 0.9578

3. 数据集、预训练模型、文件结构

3.1 数据集

训练和测试数据为 SIDD-Medium，需要下载并分 patch.

已将分好 patch 的数据放在了 Ai Studio 里.

可直接运行下面的脚本解压：

In [ ]

!cd data && tar -xf data140841/SIDD_patches.tar.gz

3.2 预训练模型

MIRNet V1:

官方预训练模型，已转为 paddle 的，名为 MIRNetV1_torch.pdparams.复现的模型，名为 MIRNetV1_paddle.pdparams.pytorch 的初始化参数，名为 torch_init.pdparams

MIRNet V2:

复现的模型，名为 MIRNetV2_paddle.pdparams，导出的静态图模型参数包括 model.pdmodel 和 model.pdiparams.

运行以下脚本解压：

In [ ]

!unzip data/data150163/pretrained_models.zip -d work/pretrained_models

3.3 文件结构

MIRNet_Paddle    |-- configs                       # 单机单卡/四卡训练配置文件    |-- dataloaders                # 数据集相关文件    |-- SIDD_patches         |-- train                      # SIDD-Medium 训练数据         |-- val                         # SIDD 测试数据    |-- networks         |-- MIRNet_model.py          # MIRNetV1模型代码         |-- MIRNet_V2_model.py    # MIRNetV2模型代码    |-- pretrained_models              # 预训练模型    |-- utils                                     # 一些工具代码    |-- config.py                             # 配置文件    |-- losses.py                             # 损失函数    |-- test_denoising_sidd.py       # 测试SIDD数据上的指标    |-- train_denoising.py              # 训练代码

4. 环境依赖

PaddlePaddle >= 2.2.0

scikit-image == 0.19.2

In [ ]

!pip install scikit-image natsort yacs

5. 核心代码

MIRNet 的核心为 MRB 模块，核心代码为：

class MSRB(nn.Layer):    def __init__(self, n_feat, height, width, stride, bias):        super(MSRB, self).__init__()        self.n_feat, self.height, self.width = n_feat, height, width        self.blocks = nn.LayerList([nn.LayerList([DAU(int(n_feat*stride**i))]*width) for i in range(height)])        INDEX = np.arange(0,width, 2)        FEATS = [int((stride**i)*n_feat) for i in range(height)]        SCALE = [2**i for i in range(1,height)]        self.last_up   = nn.LayerDict()        for i in range(1,height):            self.last_up.update({f'{i}': UpSample(int(n_feat*stride**i),2**i,stride)})        self.down = nn.LayerDict()        self.up   = nn.LayerDict()        i=0        SCALE.reverse()        for feat in FEATS:            for scale in SCALE[i:]:                self.down.update({f'{feat}_{scale}': DownSample(feat,scale,stride)})            i+=1        i=0        FEATS.reverse()        for feat in FEATS:            for scale in SCALE[i:]:                                self.up.update({f'{feat}_{scale}': UpSample(feat,scale,stride)})            i+=1        self.conv_out = nn.Conv2D(n_feat, n_feat, kernel_size=3, padding=1, bias_attr=bias)        self.selective_kernel = nn.LayerList([SKFF(n_feat*stride**i, height) for i in range(height)])    def forward(self, x):        inp = x.clone()        #col 1 only        blocks_out = []        for j in range(self.height):            if j==0:                inp = self.blocks[j][0](inp)            else:                inp = self.blocks[j][0](self.down[f'{inp.shape[1]}_{2}'](inp))            blocks_out.append(inp)        #rest of grid        for i in range(1,self.width):            #Mesh            # Replace condition(i%2!=0) with True(Mesh) or False(Plain)            # if i%2!=0:            tmp=[]            for j in range(self.height):                TENSOR = []                nfeats = (2**j)*self.n_feat                for k in range(self.height):                    TENSOR.append(self.select_up_down(blocks_out[k], j, k))                selective_kernel_fusion = self.selective_kernel[j](TENSOR)                tmp.append(selective_kernel_fusion)            #Forward through either mesh or plain            for j in range(self.height):                blocks_out[j] = self.blocks[j][i](tmp[j])        #Sum after grid        out=[]        for k in range(self.height):            out.append(self.select_last_up(blocks_out[k], k))          out = self.selective_kernel[0](out)        out = self.conv_out(out)        out = out + x        return out    def select_up_down(self, tensor, j, k):        if j==k:            return tensor        else:            diff = 2 ** np.abs(j-k)            if j<k:                return self.up[f'{tensor.shape[1]}_{diff}'](tensor)            else:                return self.down[f'{tensor.shape[1]}_{diff}'](tensor)    def select_last_up(self, tensor, k):        if k==0:            return tensor        else:            return self.last_up[f'{k}'](tensor)

损失函数采用 Charbonnier Loss，实现较为简单，代码如下：

class CharbonnierLoss(nn.Layer):    """Charbonnier Loss (L1)"""    def __init__(self, eps=1e-3):        super(CharbonnierLoss, self).__init__()        self.eps = eps    def forward(self, x, y):        diff = x - y        # loss = paddle.sum(paddle.sqrt(diff * diff + self.eps))        loss = paddle.mean(paddle.sqrt((diff * diff) + (self.eps*self.eps)))        return loss

6. 快速开始

配置文件在work/configs下，可修改学习率、batch_size等参数

对于MIRNet V1（论文复现赛93题），单卡运行的配置文件为MIRNet_1cards.yml：

优化相关的设置：batch_size设置为4，epoch设为60，初始学习率设为2e-4.

OPTIM:  BATCH_SIZE: [4]  NUM_EPOCHS: [60]  LR_INITIAL: 2e-4

对于MIRNet V2（特色模型挑战赛5），单卡运行的配置文件为MIRNetV2_1cards.yml：

采用Progressive Learning，即逐渐增大输入的patch_size，并减小batch_size，此处patch_size从128增加到256，batch_size从8减小到2，各个patch_size对应epoch数为30、15、10、5.

OPTIM:  BATCH_SIZE: [8,6,4,2]  NUM_EPOCHS: [30,15,10,5]  LR_INITIAL: 2e-4  TRAINING:  PATCH_SIZE: [128,160,192,256]  NUM_WORKERS: [4,4,4,4]

注：学习策略采用Warm up + Cosine Anneal LR，其中Warm up的epoch数为3.

6.1 模型训练

MIRNet V1单卡运行的代码如下：

In [ ]

!cd work && python train_denoising.py --model MIRNet --gpus 1

同时给出 MIRNet 单机四卡和 MIRNet V2 的训练脚本，为更好的体验 MIRNet 的训练并得到复现结果，请使用脚本任务.

## MIRnet V1# 单机四卡!cd work && python -m paddle.distributed.launch train_denoising.py --model MIRNet --gpus 4## MIRNet V2# 单机单卡!cd work && python train_denoising.py --model MIRNetV2 --gpus 1# 单机四卡!cd work && python -m paddle.distributed.launch train_denoising.py --model MIRNetV2 --gpus 4

训练过程会将模型参数保存在 ./ckpt/Denoising/model/ 文件夹下.

6.2 日志读取

训练过程会将日志记录保存在 ./ckpt/Denoising/logs/ 文件夹下，例如 MIRNet V2 的日志目录为 ./ckpt/Denoising/logs/MIRNet_V2/

日志是用 VisualDL 工具记录的，可在 CodeLab 左侧的数据模型可视化中，设置 logdir 查看.

6.3 模型评估

在 SIDD 测试数据上作测试，以 MIRNet V1 为例，若想测试 MIRNet V2，只需将 –model MIRNet 改为 MIRNetV2，同时修改权重weights路径.

In [ ]

# MIRNet V1!cd work && python test_denoising_sidd.py --input_dir ../data/SIDD_patches/val --weights ./pretrained_models/MIRNetV1_paddle.pdparams --model MIRNet

输出如下：

# MIRNet V1PSNR: 39.6872 SSIM: 0.9586# MIRNet V2PSNR: 39.5286SSIM: 0.9578

达到了验收精度.

6.4 模型预测

在 SIDD 小验证集上作预测，结果存放在 work/results/ 文件夹下，下以 MIRNet V1 为例，对于 MIRNet V2，同上修改weight和model.

In [ ]

# MIRNet V1!cd work && python predict.py --data_path ./SIDD_patches/val_mini/ --save_path results/ --save_images --model_ckpt ./pretrained_models/MIRNetV1_paddle.pdparams --model MIRNet

6.5 单张图像去噪测试

导入单张图像，测试去噪效果，首先需要在work/test_images里上传一张图片.

In [41]

# 先上传一张图片，import os.path as ospfrom IPython.display import displayfrom PIL import Imageimg_path = 'bird.png' # 改成自己上传的图片名称full_img_path = osp.join(osp.abspath('work/test_images/'), img_path)img = Image.open(full_img_path).convert('RGB')print('以下为上传的图片:')display(img)

以下为上传的图片:

以 MIRNet V1 为例，对于 MIRNet V2，同上修改model_ckpt和model.

需要指定干净图像和噪声图像，可以只给一张噪声图片，也可以只给一张干净图片，也可以都给.

给定一张噪声图片：指定参数noisy_img，直接输出去噪图片.

给定一张干净图片：指定参数clean_img和noisyL，后者为噪声水平，默认为15，输出加噪图片和去噪图片.

给定噪声图片和干净图片：直接输出去噪图片.

In [ ]

# MIRNet V1 仅给定干净图片，噪声水平为15!cd work && python predict_single.py --clean_img $full_img_path --save_images --model_ckpt ./pretrained_models/MIRNetV1_paddle.pdparams --model MIRNet

In [45]

# 去噪效果查看import globfrom IPython.display import displayfrom PIL import Imageimgs = glob.glob('work/test_images/*')for path in imgs:    print(path)    img = Image.open(path)    display(img)

work/test_images/bird_noised.png

work/test_images/bird_denoised.png

work/test_images/bird.png

以上就是【图像去噪】第六期论文复现赛——MIRNet的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/58516.html

ai cos fig git igs python red udio 工具

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

绕不过的BP算法，从这里开始！

上一篇 2025年11月10日 09:20:03

【NLP】常规赛：中文新闻文本标题分类

下一篇 2025年11月10日 10:06:50

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
5000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
2000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
1000
好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

旋转长方形后，如何计算其相对于画布左上角的轴距？

绘制长方形并旋转，计算旋转后轴距在拥有 1920×1080 画布中，放置一个宽高为 200×20 的长方形，其坐标位于 (100, 100)。当以任意角度旋转长方形时，如何计算它相对于画布左上角的 x、y 轴距？以下代码提供了一个计算旋转后长方形轴距的解决方案： const x = 200;co…

程序猿
2025年12月24日
0000
好文分享

旋转长方形后，如何计算它与画布左上角的xy轴距？

旋转后长方形在画布上的xy轴距计算在画布中添加一个长方形，并将其旋转任意角度，如何计算旋转后的长方形与画布左上角之间的xy轴距？问题分解：要计算旋转后长方形的xy轴距，需要考虑旋转对长方形宽高和位置的影响。首先，旋转会改变长方形的长和宽，其次，旋转会改变长方形的中心点位置。求解方法：计算旋…

程序猿
2025年12月24日
0000
好文分享

旋转长方形后如何计算其在画布上的轴距？

旋转长方形后计算轴距假设长方形的宽、高分别为 200 和 20，初始坐标为 (100, 100)，我们将它旋转一个任意角度。根据旋转矩阵公式，旋转后的新坐标 (x’, y’) 可以通过以下公式计算： x’ = x * cos(θ) – y * sin(θ)y’ = x * …

程序猿
2025年12月24日
0000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
0000
好文分享

如何计算旋转后长方形在画布上的轴距？

旋转后长方形与画布轴距计算在给定的画布中，有一个长方形，在随机旋转一定角度后，如何计算其在画布上的轴距，即距离左上角的距离？以下提供一种计算长方形相对于画布左上角的新轴距的方法： const x = 200; // 初始 x 坐标const y = 90; // 初始 y 坐标const w =…

程序猿
2025年12月24日
2000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
2000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

如何计算旋转后的长方形在画布上的 XY 轴距？

旋转长方形后计算其画布xy轴距在创建的画布上添加了一个长方形，并提供其宽、高和初始坐标。为了视觉化旋转效果，还提供了一些旋转特定角度后的图片。问题是如何计算任意角度旋转后，这个长方形的xy轴距。这涉及到使用三角学来计算旋转后的坐标。以下是一个 javascript 代码示例，用于计算旋转后长方…

程序猿
2025年12月24日
0000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000