百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案

该方案为百度网盘AI大赛手写文字擦除挑战赛第10名方案,基于MTRNet++实现。先介绍文字擦除算法及GAN结构,再说明MTRNet++的改进、结构与损失函数。接着阐述制作流程,包括数据处理、训练、测试等步骤,还给出涨点思路,其在相关数据集上表现优异。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

百度网盘ai大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案

基于MTRNet++ 实现图像文字擦除

百度网盘大赛二,手写文字擦除

一、 如果高考能重来一次……

1.这是不是考完试,卷纸发下来之后,你的姿势 百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

2.面对试卷上的错题,心里会想点什么….. 百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

3.脑海中一定想过:如果有橡皮擦

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

4.考试能不能重来一次

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

5.高考想重来,前提是要有橡皮擦

二、做橡皮擦要分几步

给定一幅自然场景图像,只将图像中文字区域抹去而不改动其他区域像素值的方法称为文字擦除算法。该方法在隐私保护,身份信息篡改,数据增广等领域有着广泛的应用和研究前景。百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

受传统生成对抗网络(GAN)算法的启发,基于深度学习的文字擦除算法都采用了类似的生成器+判别器的结构,其损失函数为:

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

整个式子由两项构成。x表示真实图片,z表示输入G网络的噪声,而G(z)表示G网络生成的图片。D(x)表示D网络判断真实图片是否真实的概率(因为x就是真实的,所以对于D来说,这个值越接近1越好)。而D(G(z))是D网络判断G生成的图片的是否真实的概率。G的目的:上面提到过,D(G(z))是D网络判断G生成的图片是否真实的概率,G应该希望自己生成的图片“越接近真实越好”。也就是说,G希望D(G(z))尽可能的大,这时V(D, G)会变小。因此我们看到式子的最前面的记号是min_G。D的目的:D的能力越强,D(x)应该越大,D(G(z))应该越小。这时V(D,G)会变大。因此式子对于D来说是求最大(max_D)。

三、怎么做一个有思想的橡皮檫:MTRNet++

文字擦除可以分为两个子任务:1)文字区域定位。2)文字内容擦除

为了将两个子任务进行更好的学习,从而实现更准确的文字擦除结果,MTRNet在输入引入文字分割结果,让网络能够感知文字区域的位置信息,从而降低任务难度,实现更准确的擦除结果。但是由于需要提前知道文字区域的准确位置信息,所以这些方法具有一定的局限性。

MTRNet++在STRNet基础上进行了改进(下图),通过引入一个微调子网络降低了整体网络对输入位置信息的依赖性,从而实现更鲁棒的文字擦除算法。

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

1.生成器由三个分支组成:掩码精化分支、粗修分支和接在两个分支后面的精修分支。

2.输入数据由图像和掩码按通道连接而成,掩码可以随机生成,也可以通过预处理得到。

3.判别器是PatchGAN结构,也可以是加了谱归一化的SN-PatchGAN。

4.生成器的损失,由L1,Style,Perceptual和对抗损失组成: 百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

5.判别器的损失是对抗损失:

爱图表 爱图表

AI驱动的智能化图表创作平台

爱图表 305 查看详情 爱图表

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

四、制作橡皮擦

In [1]

#1.准备原料:解压比赛的数据集!unzip data/data121261/dehw_train_dataset.zip -d data/ >>/dev/null#!unzip data/data121261/dehw_testA_dataset.zip -d data/ >>/dev/null

In [2]

!unzip data/data126180/dehw_testB_dataset.zip -d data/ >>/dev/null

In [4]

## 数据EDAimport os.pathimport globimport refrom PIL import Imagepath = '/home/aistudio/data/dehw_train_dataset/images'  #训练数据路径dirname='/home/aistudio/work/'im_files = glob.glob(os.path.join(path, "*.jpg"))im_files.sort()print('训练集数量 {}'.format(len(im_files)))train_file = open(os.path.join(dirname, 'train.txt'), 'w')    for index,filename in enumerate(im_files):     im = Image.open(filename)#返回一个Image对象       #打开该图像    filepath = os.path.join(dirname, filename)     print("%st%st%sn" % (filename,im.size[0],im.size[1]),file=train_file)  #输入图像名称、图像高度和宽度到指定txt中。train_file.close() path = '/home/aistudio/data/dehw_testB_dataset/'  #训练数据路径im_files = glob.glob(os.path.join(path, "*.jpg"))im_files.sort()print('测试集数量 {}'.format(len(im_files)))test_file = open(os.path.join(dirname, 'test.txt'), 'w')    for index,filename in enumerate(im_files):     im = Image.open(filename)#返回一个Image对象       #打开该图像    filepath = os.path.join(dirname, filename)     print ("%st%st%sn" % (filename,im.size[0],im.size[1]),file=test_file)  #输入图像名称、图像高度和宽度到指定txt中。test_file.close()
训练集数量 1081测试集数量 200

In [6]

%matplotlib inlineimport pandas as pdimport matplotlib.pyplot as pltdf = pd.read_table('/home/aistudio/work/train.txt',header=None,index_col=False)plt.figure(figsize=(10,4))plt.title('Width of TrainSet') #训练集图像宽度分布hc = df[2].groupby(df[1])hc.count().plot.bar()plt.figure(figsize=(10,4))plt.title('Height of TrainSet') #训练集图像高度分布wc = df[1].groupby(df[2])wc.count().plot.bar()

In [10]

import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_table('/home/aistudio/work/test.txt',header=None,index_col=False)plt.figure(figsize=(10,4))plt.title('Width of TestB Set') #测试集A图像宽度分布hc = df[2].groupby(df[1])hc.count().plot.bar()plt.figure(figsize=(10,4))plt.title('Height of TestB Set') #测试集A图像高度分布wc = df[1].groupby(df[2])wc.count().plot.bar()

In [3]

#2.准备工具!pip install scikit_image -q

In [2]

#3.用训练图像和标签生成掩码#%cd work/scripts/#!python generate_bbox.py

In [ ]

#4.调好原料比例,生成数据集#%cd work/scripts/#!python create_dataset.py

In [ ]

#5.调好配方,其中MASK类型8为固定生成;#  或者用上面生成的BBOX Mask,MASK类型设为7;#  如果是图像类型的Mask,设为3。#!cat /home/aistudio/work/config/config.yml

In [ ]

#5.反复制作#%cd /home/aistudio/work/#!python train.py

(1)output目录下文件夹的log目录下保存日志文件,训练过程中的参数保存在model目录下。

(2)断点接续训练,在config.yml文件中设置G_MODEL_PATH和D_MODEL_PATH为保存过模型的路径。

(3)可以通过左侧的VisualDL的数据模型可视化功能,查看训练指标和训练过程中生成的图像。

                             训练指标可视化

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

                           训练过程生成的图像

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

  上图中:左为输入原始图像,    中间为标签图像,        右边为生成图像

In [3]

#6.检查质量%cd /home/aistudio/work/!python test.py --config /home/aistudio/work/config/config.yml     --mode 3 --dataset_root /home/aistudio/data/dehw_testB_dataset/     --pretrained /home/aistudio/output/20211222-213549/model/MaskInpaintModel_gen_25000.pdparams
/home/aistudio/work/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/__init__.py:107: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working  from collections import MutableMapping/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/rcsetup.py:20: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working  from collections import Iterable, Mapping/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/matplotlib/colors.py:53: DeprecationWarning: Using or importing the ABCs from 'collections' instead of from 'collections.abc' is deprecated, and in 3.8 it will stop working  from collections import SizedW0126 08:50:00.091639   381 device_context.cc:447] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1W0126 08:50:00.096752   381 device_context.cc:465] device: 0, cuDNN Version: 7.6.100%|████████████████████████████████| 561203/561203 [00:15<00:00, 37040.88it/s]Loading MaskInpaintModel generator...Loading MaskInpaintModel generator.../home/aistudio/data/dehw_testB_dataset/dehw_testB_1.jpg [3208] [2088]/home/aistudio/data/dehw_testB_dataset/dehw_testB_10.jpg [2132] [1756]/home/aistudio/data/dehw_testB_dataset/dehw_testB_100.jpg [2920] [2056]/home/aistudio/data/dehw_testB_dataset/dehw_testB_101.jpg [3132] [1956]/home/aistudio/data/dehw_testB_dataset/dehw_testB_102.jpg [3108] [2108]/home/aistudio/data/dehw_testB_dataset/dehw_testB_103.jpg [3172] [1980]/home/aistudio/data/dehw_testB_dataset/dehw_testB_104.jpg [3176] [2092]/home/aistudio/data/dehw_testB_dataset/dehw_testB_105.jpg [4084] [2976]/home/aistudio/data/dehw_testB_dataset/dehw_testB_106.jpg [4324] [2968]/home/aistudio/data/dehw_testB_dataset/dehw_testB_107.jpg [2280] [1836]/home/aistudio/data/dehw_testB_dataset/dehw_testB_108.jpg [3340] [1988]/home/aistudio/data/dehw_testB_dataset/dehw_testB_109.jpg [2160] [3380]/home/aistudio/data/dehw_testB_dataset/dehw_testB_11.jpg [3100] [2160]/home/aistudio/data/dehw_testB_dataset/dehw_testB_110.jpg [3976] [2928]/home/aistudio/data/dehw_testB_dataset/dehw_testB_111.jpg [860] [896]/home/aistudio/data/dehw_testB_dataset/dehw_testB_112.jpg [1864] [2040]/home/aistudio/data/dehw_testB_dataset/dehw_testB_113.jpg [2088] [2548]/home/aistudio/data/dehw_testB_dataset/dehw_testB_114.jpg [3152] [2036]/home/aistudio/data/dehw_testB_dataset/dehw_testB_115.jpg [3228] [2152]/home/aistudio/data/dehw_testB_dataset/dehw_testB_116.jpg [2868] [2052]/home/aistudio/data/dehw_testB_dataset/dehw_testB_117.jpg [4396] [3136]/home/aistudio/data/dehw_testB_dataset/dehw_testB_118.jpg [2448] [1796]/home/aistudio/data/dehw_testB_dataset/dehw_testB_119.jpg [3284] [2152]/home/aistudio/data/dehw_testB_dataset/dehw_testB_12.jpg [905] [896]/home/aistudio/data/dehw_testB_dataset/dehw_testB_120.jpg [2272] [1844]/home/aistudio/data/dehw_testB_dataset/dehw_testB_121.jpg [3096] [2108]/home/aistudio/data/dehw_testB_dataset/dehw_testB_122.jpg [3672] [2148]/home/aistudio/data/dehw_testB_dataset/dehw_testB_123.jpg [3172] [2196]/home/aistudio/data/dehw_testB_dataset/dehw_testB_124.jpg [3416] [2156]/home/aistudio/data/dehw_testB_dataset/dehw_testB_125.jpg [2876] [2068]/home/aistudio/data/dehw_testB_dataset/dehw_testB_126.jpg [3036] [2084]/home/aistudio/data/dehw_testB_dataset/dehw_testB_127.jpg [3964] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_128.jpg [3232] [2140]/home/aistudio/data/dehw_testB_dataset/dehw_testB_129.jpg [3400] [2100]/home/aistudio/data/dehw_testB_dataset/dehw_testB_13.jpg [3084] [2088]/home/aistudio/data/dehw_testB_dataset/dehw_testB_130.jpg [2920] [3980]/home/aistudio/data/dehw_testB_dataset/dehw_testB_131.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_132.jpg [4032] [2968]/home/aistudio/data/dehw_testB_dataset/dehw_testB_133.jpg [3992] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_134.jpg [3840] [3036]/home/aistudio/data/dehw_testB_dataset/dehw_testB_135.jpg [3812] [2936]/home/aistudio/data/dehw_testB_dataset/dehw_testB_136.jpg [4000] [3000]/home/aistudio/data/dehw_testB_dataset/dehw_testB_137.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_138.jpg [3996] [2932]/home/aistudio/data/dehw_testB_dataset/dehw_testB_139.jpg [3000] [4000]/home/aistudio/data/dehw_testB_dataset/dehw_testB_14.jpg [3220] [2084]/home/aistudio/data/dehw_testB_dataset/dehw_testB_140.jpg [3004] [3332]/home/aistudio/data/dehw_testB_dataset/dehw_testB_141.jpg [3960] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_142.jpg [4092] [2636]/home/aistudio/data/dehw_testB_dataset/dehw_testB_143.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_144.jpg [4188] [2908]/home/aistudio/data/dehw_testB_dataset/dehw_testB_145.jpg [3976] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_146.jpg [4128] [2732]/home/aistudio/data/dehw_testB_dataset/dehw_testB_147.jpg [3968] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_148.jpg [3032] [3348]/home/aistudio/data/dehw_testB_dataset/dehw_testB_149.jpg [4100] [2708]/home/aistudio/data/dehw_testB_dataset/dehw_testB_15.jpg [3956] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_150.jpg [4116] [2992]/home/aistudio/data/dehw_testB_dataset/dehw_testB_151.jpg [3984] [2976]/home/aistudio/data/dehw_testB_dataset/dehw_testB_152.jpg [3944] [2968]/home/aistudio/data/dehw_testB_dataset/dehw_testB_153.jpg [3016] [3956]/home/aistudio/data/dehw_testB_dataset/dehw_testB_154.jpg [4112] [2956]/home/aistudio/data/dehw_testB_dataset/dehw_testB_155.jpg [3956] [2976]/home/aistudio/data/dehw_testB_dataset/dehw_testB_156.jpg [3952] [3020]/home/aistudio/data/dehw_testB_dataset/dehw_testB_157.jpg [4324] [2112]/home/aistudio/data/dehw_testB_dataset/dehw_testB_158.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_159.jpg [3952] [2708]/home/aistudio/data/dehw_testB_dataset/dehw_testB_16.jpg [3184] [2156]/home/aistudio/data/dehw_testB_dataset/dehw_testB_160.jpg [3996] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_161.jpg [3976] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_162.jpg [4104] [2940]/home/aistudio/data/dehw_testB_dataset/dehw_testB_163.jpg [4180] [2516]/home/aistudio/data/dehw_testB_dataset/dehw_testB_164.jpg [3988] [2968]/home/aistudio/data/dehw_testB_dataset/dehw_testB_165.jpg [4048] [2736]/home/aistudio/data/dehw_testB_dataset/dehw_testB_166.jpg [2996] [3324]/home/aistudio/data/dehw_testB_dataset/dehw_testB_167.jpg [3964] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_168.jpg [4080] [2968]/home/aistudio/data/dehw_testB_dataset/dehw_testB_169.jpg [3976] [2516]/home/aistudio/data/dehw_testB_dataset/dehw_testB_17.jpg [1028] [880]/home/aistudio/data/dehw_testB_dataset/dehw_testB_170.jpg [4004] [2820]/home/aistudio/data/dehw_testB_dataset/dehw_testB_171.jpg [4176] [2808]/home/aistudio/data/dehw_testB_dataset/dehw_testB_172.jpg [3996] [2976]/home/aistudio/data/dehw_testB_dataset/dehw_testB_173.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_174.jpg [4000] [3000]/home/aistudio/data/dehw_testB_dataset/dehw_testB_175.jpg [3960] [2728]/home/aistudio/data/dehw_testB_dataset/dehw_testB_176.jpg [4144] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_177.jpg [4368] [2916]/home/aistudio/data/dehw_testB_dataset/dehw_testB_178.jpg [4104] [1880]/home/aistudio/data/dehw_testB_dataset/dehw_testB_179.jpg [3992] [2956]/home/aistudio/data/dehw_testB_dataset/dehw_testB_18.jpg [4044] [2796]/home/aistudio/data/dehw_testB_dataset/dehw_testB_180.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_181.jpg [3112] [3788]/home/aistudio/data/dehw_testB_dataset/dehw_testB_182.jpg [3900] [2744]/home/aistudio/data/dehw_testB_dataset/dehw_testB_183.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_184.jpg [2968] [2452]/home/aistudio/data/dehw_testB_dataset/dehw_testB_185.jpg [3976] [2172]/home/aistudio/data/dehw_testB_dataset/dehw_testB_186.jpg [3964] [2648]/home/aistudio/data/dehw_testB_dataset/dehw_testB_187.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_188.jpg [4264] [2972]/home/aistudio/data/dehw_testB_dataset/dehw_testB_189.jpg [3992] [3040]/home/aistudio/data/dehw_testB_dataset/dehw_testB_19.jpg [2980] [2012]/home/aistudio/data/dehw_testB_dataset/dehw_testB_190.jpg [2668] [3896]/home/aistudio/data/dehw_testB_dataset/dehw_testB_191.jpg [3972] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_192.jpg [3904] [2980]/home/aistudio/data/dehw_testB_dataset/dehw_testB_193.jpg [4360] [2996]/home/aistudio/data/dehw_testB_dataset/dehw_testB_194.jpg [3976] [2728]/home/aistudio/data/dehw_testB_dataset/dehw_testB_195.jpg [3968] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_196.jpg [3988] [2928]/home/aistudio/data/dehw_testB_dataset/dehw_testB_197.jpg [4008] [2312]/home/aistudio/data/dehw_testB_dataset/dehw_testB_198.jpg [3976] [2956]/home/aistudio/data/dehw_testB_dataset/dehw_testB_199.jpg [3968] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_2.jpg [3044] [1920]/home/aistudio/data/dehw_testB_dataset/dehw_testB_20.jpg [3224] [2056]/home/aistudio/data/dehw_testB_dataset/dehw_testB_200.jpg [4092] [2880]/home/aistudio/data/dehw_testB_dataset/dehw_testB_21.jpg [4284] [2804]/home/aistudio/data/dehw_testB_dataset/dehw_testB_22.jpg [4076] [2636]/home/aistudio/data/dehw_testB_dataset/dehw_testB_23.jpg [3080] [2096]/home/aistudio/data/dehw_testB_dataset/dehw_testB_24.jpg [1772] [1264]/home/aistudio/data/dehw_testB_dataset/dehw_testB_25.jpg [4028] [2984]/home/aistudio/data/dehw_testB_dataset/dehw_testB_26.jpg [2820] [2072]/home/aistudio/data/dehw_testB_dataset/dehw_testB_27.jpg [3976] [2944]/home/aistudio/data/dehw_testB_dataset/dehw_testB_28.jpg [3076] [2144]/home/aistudio/data/dehw_testB_dataset/dehw_testB_29.jpg [3056] [2064]/home/aistudio/data/dehw_testB_dataset/dehw_testB_3.jpg [3464] [2284]/home/aistudio/data/dehw_testB_dataset/dehw_testB_30.jpg [2140] [2144]/home/aistudio/data/dehw_testB_dataset/dehw_testB_31.jpg [3232] [2136]/home/aistudio/data/dehw_testB_dataset/dehw_testB_32.jpg [3168] [2156]/home/aistudio/data/dehw_testB_dataset/dehw_testB_33.jpg [2856] [2052]/home/aistudio/data/dehw_testB_dataset/dehw_testB_34.jpg [2948] [1968]/home/aistudio/data/dehw_testB_dataset/dehw_testB_35.jpg [1748] [1188]/home/aistudio/data/dehw_testB_dataset/dehw_testB_36.jpg [3196] [2124]/home/aistudio/data/dehw_testB_dataset/dehw_testB_37.jpg [3260] [2116]/home/aistudio/data/dehw_testB_dataset/dehw_testB_38.jpg [3236] [2040]/home/aistudio/data/dehw_testB_dataset/dehw_testB_39.jpg [3420] [2184]/home/aistudio/data/dehw_testB_dataset/dehw_testB_4.jpg [3968] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_40.jpg [3108] [2116]/home/aistudio/data/dehw_testB_dataset/dehw_testB_41.jpg [3104] [2060]/home/aistudio/data/dehw_testB_dataset/dehw_testB_42.jpg [4060] [2948]/home/aistudio/data/dehw_testB_dataset/dehw_testB_43.jpg [2112] [1800]/home/aistudio/data/dehw_testB_dataset/dehw_testB_44.jpg [3796] [2156]/home/aistudio/data/dehw_testB_dataset/dehw_testB_45.jpg [3564] [2148]/home/aistudio/data/dehw_testB_dataset/dehw_testB_46.jpg [3268] [2148]/home/aistudio/data/dehw_testB_dataset/dehw_testB_47.jpg [2900] [2044]/home/aistudio/data/dehw_testB_dataset/dehw_testB_48.jpg [3308] [2112]/home/aistudio/data/dehw_testB_dataset/dehw_testB_49.jpg [3304] [2100]/home/aistudio/data/dehw_testB_dataset/dehw_testB_5.jpg [2944] [2052]/home/aistudio/data/dehw_testB_dataset/dehw_testB_50.jpg [3004] [2048]/home/aistudio/data/dehw_testB_dataset/dehw_testB_51.jpg [3480] [2072]/home/aistudio/data/dehw_testB_dataset/dehw_testB_52.jpg [1928] [1348]/home/aistudio/data/dehw_testB_dataset/dehw_testB_53.jpg [3380] [2032]/home/aistudio/data/dehw_testB_dataset/dehw_testB_54.jpg [3196] [2088]/home/aistudio/data/dehw_testB_dataset/dehw_testB_55.jpg [2180] [2076]/home/aistudio/data/dehw_testB_dataset/dehw_testB_56.jpg [3508] [2032]/home/aistudio/data/dehw_testB_dataset/dehw_testB_57.jpg [3240] [2044]/home/aistudio/data/dehw_testB_dataset/dehw_testB_58.jpg [4080] [2848]/home/aistudio/data/dehw_testB_dataset/dehw_testB_59.jpg [2972] [2004]/home/aistudio/data/dehw_testB_dataset/dehw_testB_6.jpg [2212] [1860]/home/aistudio/data/dehw_testB_dataset/dehw_testB_60.jpg [3468] [2116]/home/aistudio/data/dehw_testB_dataset/dehw_testB_61.jpg [3068] [2072]/home/aistudio/data/dehw_testB_dataset/dehw_testB_62.jpg [3260] [2092]/home/aistudio/data/dehw_testB_dataset/dehw_testB_63.jpg [4064] [2964]/home/aistudio/data/dehw_testB_dataset/dehw_testB_64.jpg [3124] [2108]/home/aistudio/data/dehw_testB_dataset/dehw_testB_65.jpg [2204] [2440]/home/aistudio/data/dehw_testB_dataset/dehw_testB_66.jpg [3200] [2196]/home/aistudio/data/dehw_testB_dataset/dehw_testB_67.jpg [4000] [3000]/home/aistudio/data/dehw_testB_dataset/dehw_testB_68.jpg [3264] [2176]/home/aistudio/data/dehw_testB_dataset/dehw_testB_69.jpg [2768] [1884]/home/aistudio/data/dehw_testB_dataset/dehw_testB_7.jpg [3972] [2940]/home/aistudio/data/dehw_testB_dataset/dehw_testB_70.jpg [4332] [3040]/home/aistudio/data/dehw_testB_dataset/dehw_testB_71.jpg [3188] [2120]/home/aistudio/data/dehw_testB_dataset/dehw_testB_72.jpg [4192] [2980]/home/aistudio/data/dehw_testB_dataset/dehw_testB_73.jpg [4224] [1580]/home/aistudio/data/dehw_testB_dataset/dehw_testB_74.jpg [2464] [2444]/home/aistudio/data/dehw_testB_dataset/dehw_testB_75.jpg [2136] [1748]/home/aistudio/data/dehw_testB_dataset/dehw_testB_76.jpg [3200] [2080]/home/aistudio/data/dehw_testB_dataset/dehw_testB_77.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_78.jpg [3952] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_79.jpg [3392] [2024]/home/aistudio/data/dehw_testB_dataset/dehw_testB_8.jpg [1724] [1260]/home/aistudio/data/dehw_testB_dataset/dehw_testB_80.jpg [3340] [2208]/home/aistudio/data/dehw_testB_dataset/dehw_testB_81.jpg [3416] [2100]/home/aistudio/data/dehw_testB_dataset/dehw_testB_82.jpg [4628] [3300]/home/aistudio/data/dehw_testB_dataset/dehw_testB_83.jpg [3248] [2212]/home/aistudio/data/dehw_testB_dataset/dehw_testB_84.jpg [3984] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_85.jpg [3416] [2052]/home/aistudio/data/dehw_testB_dataset/dehw_testB_86.jpg [3184] [2156]/home/aistudio/data/dehw_testB_dataset/dehw_testB_87.jpg [3084] [2156]/home/aistudio/data/dehw_testB_dataset/dehw_testB_88.jpg [3132] [2220]/home/aistudio/data/dehw_testB_dataset/dehw_testB_89.jpg [2888] [2044]/home/aistudio/data/dehw_testB_dataset/dehw_testB_9.jpg [3324] [2092]/home/aistudio/data/dehw_testB_dataset/dehw_testB_90.jpg [3108] [2108]/home/aistudio/data/dehw_testB_dataset/dehw_testB_91.jpg [2630] [1852]/home/aistudio/data/dehw_testB_dataset/dehw_testB_92.jpg [2440] [1776]/home/aistudio/data/dehw_testB_dataset/dehw_testB_93.jpg [4688] [3252]/home/aistudio/data/dehw_testB_dataset/dehw_testB_94.jpg [3964] [2920]/home/aistudio/data/dehw_testB_dataset/dehw_testB_95.jpg [3568] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_96.jpg [3364] [2096]/home/aistudio/data/dehw_testB_dataset/dehw_testB_97.jpg [2824] [2080]/home/aistudio/data/dehw_testB_dataset/dehw_testB_98.jpg [3964] [2960]/home/aistudio/data/dehw_testB_dataset/dehw_testB_99.jpg [3264] [2140]The running time of an image is : 10.371857 s

In [ ]

#7.试试效果,压缩文件提交评分%cd /home/aistudio/work/test_result/!zip result.zip *.png *.txt

保存的文件在test_result路径中,进入该路径创建readme.txt文件,输入要求的内容:

训练框架:PaddlePaddle

代码运行环境:V100

是否使用GPU:是

单张图片耗时/s:1

模型大小:45

其他说明:算法参考MTRNet++

总结

手写文字擦除比赛的数据集很有挑战性,涨点的思路供参考:

1.利用外部数据和预训练模型,在比赛数据集在微调;

2.优化Mask的生成方式,准确定位待擦除的文字区域;

3.调整模型结构;

4.调整Config文件中的超参数。

百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案 - 创想鸟

上表是论文中显示,MTRNet++在SCUT和Oxford数据集上获得SOTA。

以上就是百度网盘AI大赛——图像处理挑战赛:手写文字擦除第10名方案的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/743768.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月25日 16:37:24
下一篇 2025年11月25日 16:37:49

相关推荐

  • Uniapp 中如何不拉伸不裁剪地展示图片?

    灵活展示图片:如何不拉伸不裁剪 在界面设计中,常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。 对于不同尺寸的图片,可以采用以下处理方式: 极端宽高比:撑满屏幕宽度或高度,再等比缩放居中。非极端宽高比:居中显示,若能撑满则撑满。 然而,如果需要不拉伸不…

    2025年12月24日
    400
  • 如何让小说网站控制台显示乱码,同时网页内容正常显示?

    如何在不影响用户界面的情况下实现控制台乱码? 当在小说网站上下载小说时,大家可能会遇到一个问题:网站上的文本在网页内正常显示,但是在控制台中却是乱码。如何实现此类操作,从而在不影响用户界面(UI)的情况下保持控制台乱码呢? 答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体,并通过在客户端…

    2025年12月24日
    800
  • 如何在地图上轻松创建气泡信息框?

    地图上气泡信息框的巧妙生成 地图上气泡信息框是一种常用的交互功能,它简便易用,能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。 利用地图库的原生功能 大多数地图库,如高德地图,都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现: 高德地图 JS API 参考文…

    2025年12月24日
    400
  • 如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画?

    如何实现元素scrollleft变化时的平滑动画效果? 在许多网页应用中,滚动容器的水平滚动条(scrollleft)需要频繁使用。为了让滚动动作更加自然,你希望给scrollleft的变化添加动画效果。 解决方案:scroll-behavior 属性 要实现scrollleft变化时的平滑动画效果…

    2025年12月24日
    000
  • 如何为滚动元素添加平滑过渡,使滚动条滑动时更自然流畅?

    给滚动元素平滑过渡 如何在滚动条属性(scrollleft)发生改变时为元素添加平滑的过渡效果? 解决方案:scroll-behavior 属性 为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码: click the button to slide right!…

    2025年12月24日
    500
  • 如何选择元素个数不固定的指定类名子元素?

    灵活选择元素个数不固定的指定类名子元素 在网页布局中,有时需要选择特定类名的子元素,但这些元素的数量并不固定。例如,下面这段 html 代码中,activebar 和 item 元素的数量均不固定: *n *n 如果需要选择第一个 item元素,可以使用 css 选择器 :nth-child()。该…

    2025年12月24日
    200
  • 使用 SVG 如何实现自定义宽度、间距和半径的虚线边框?

    使用 svg 实现自定义虚线边框 如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片,但是这种方法存在引入外部资源、性能低下的缺点。 为了避免上述问题,可以使用 svg(可缩放矢量图形)来创建纯代码实现。一种方…

    2025年12月24日
    100
  • 如何解决本地图片在使用 mask JS 库时出现的跨域错误?

    如何跨越localhost使用本地图片? 问题: 在本地使用mask js库时,引入本地图片会报跨域错误。 解决方案: 要解决此问题,需要使用本地服务器启动文件,以http或https协议访问图片,而不是使用file://协议。例如: python -m http.server 8000 然后,可以…

    2025年12月24日
    200
  • 如何让“元素跟随文本高度,而不是撑高父容器?

    如何让 元素跟随文本高度,而不是撑高父容器 在页面布局中,经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中,父容器被较高的图片撑开,而文本的高度没有被考虑。本问答将提供纯css解决方案,让图片跟随文本高度,确保父容器的高度不会被图片影响。 解决方法 为了解决这个问题,需要将图片从文档流中脱离…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 如何利用 CSS 选中激活标签并影响相邻元素的样式?

    如何利用 css 选中激活标签并影响相邻元素? 为了实现激活标签影响相邻元素的样式需求,可以通过 :has 选择器来实现。以下是如何具体操作: 对于激活标签相邻后的元素,可以在 css 中使用以下代码进行设置: li:has(+li.active) { border-radius: 0 0 10px…

    2025年12月24日
    100
  • 如何模拟Windows 10 设置界面中的鼠标悬浮放大效果?

    win10设置界面的鼠标移动显示周边的样式(探照灯效果)的实现方式 在windows设置界面的鼠标悬浮效果中,光标周围会显示一个放大区域。在前端开发中,可以通过多种方式实现类似的效果。 使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

    2025年12月24日
    200
  • 为什么我的 Safari 自定义样式表在百度页面上失效了?

    为什么在 Safari 中自定义样式表未能正常工作? 在 Safari 的偏好设置中设置自定义样式表后,您对其进行测试却发现效果不同。在您自己的网页中,样式有效,而在百度页面中却失效。 造成这种情况的原因是,第一个访问的项目使用了文件协议,可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

    2025年12月24日
    000
  • 如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果?

    如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果 想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果,可以通过以下途径: CSS 解决方案 DEMO 1: Windows 10 网格悬停效果:https://codepen.io/tr4553r7/pe…

    2025年12月24日
    000
  • 使用CSS mask属性指定图片URL时,为什么浏览器无法加载图片?

    css mask属性未能加载图片的解决方法 使用css mask属性指定图片url时,如示例中所示: mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是,在网络面板中却…

    2025年12月24日
    000
  • 如何用CSS Paint API为网页元素添加时尚的斑马线边框?

    为元素添加时尚的斑马线边框 在网页设计中,有时我们需要添加时尚的边框来提升元素的视觉效果。其中,斑马线边框是一种既醒目又别致的设计元素。 实现斜向斑马线边框 要实现斜向斑马线间隔圆环,我们可以使用css paint api。该api提供了强大的功能,可以让我们在元素上绘制复杂的图形。 立即学习“前端…

    2025年12月24日
    000
  • 为什么自定义样式表在 Safari 中访问百度时无效?

    自定义样式表在 Safari 中无效的问题 你在 Safari 偏好设置中自定义的样式表无法在某些网站(例如百度)上生效,这是为什么呢? 原因在于,你创建的样式表应用于本地文件路径,而百度是一个远程网站,位于互联网上。 在访问本地项目时,文件协议(file://)会允许你访问本地计算机上的文件。所以…

    2025年12月24日
    300
  • 图片如何不撑高父容器?

    如何让图片不撑高父容器? 当父容器包含不同高度的子元素时,父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开,避免图片对其产生影响,可以通过以下 css 解决方法: 绝对定位元素: .child-image { position: absolute; top: 0; left: …

    2025年12月24日
    000
  • 为什么自定义样式表在 Safari 中访问百度页面时无法生效?

    自定义样式表在 safari 中失效的原因 用户尝试在 safari 偏好设置中添加自定义样式表,代码如下: body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现,在…

    2025年12月24日
    000
  • 使用 Mask 导入本地图片时,如何解决跨域问题?

    跨域疑难:如何解决 mask 引入本地图片产生的跨域问题? 在使用 mask 导入本地图片时,你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢?让我们深入了解一下: mask 框架假设你以 http(s) 协议加载你的 html 文件,而当使用 file:// 协议打开本地文件时,就会产生跨域…

    2025年12月24日
    200

发表回复

登录后才能评论
关注微信