从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成

本文介绍利用PaddleGAN的Pix2pix模型生成遥感图像的方法。先介绍PaddleGAN及WHDLD数据集,再说明数据集准备与处理步骤,接着讲解用pix2pix模型训练的配置、过程,最后阐述预测及结果展示,实现了通过绘制标签生成对应遥感图像,解决数据不足问题。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

从零实践基于paddlegan的反向学习分割数据生成遥感图像生成 - 创想鸟

PaddleGAN遥感图像生成

有时在使用一些遥感数据集时,常常会感觉数据不够用,能否用GAN的技术帮我们生成一些遥感图像呢?我说要有路,那便有了路~但由于技术原因一直没有做出。不过在此次GAN的七日打卡营中,我们找到了一个方便的方法。那就是使用PaddleGAN提供的Pix2pix模型,反向训练遥感分割数据集,这样我们就得到了一只神笔~当我画出一条路,那便有了一条路。具体如何做呢?请看下方分解。

0. PaddleGAN及数据集介绍

飞桨生成对抗网络开发套件–PaddleGAN,为开发者提供经典及前沿的生成对抗网络高性能实现,并支撑开发者快速构建、训练及部署生成对抗网络,以供学术、娱乐及产业应用。

从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成 - 创想鸟

数据集使用WHDLD数据集,该数据集由武汉大学在2018年发布,共有4940张256×256大小的遥感图像,包括裸地、水系、路面、道路、植被和建筑共6个类别。是一个妥妥的遥感分割数据集。(这里有个坑,因为处理的时候标签忘了转为RGB,所以水是红色的,建筑是蓝色的。。。)

从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成 - 创想鸟

1. PaddleGAN及数据集准备

首先当然是要克隆我们的PaddleGAN啦然后解压WHDLD数据,需要通过下面的代码组合生成需要的数据,当然数据已经处理好了,也可以直接解压WHDLD-GAN数据,其中还包含有训练了200个epoch的预训练参数In [ ]

# ! git clone https://gitee.com/paddlepaddle/PaddleGAN.git# ! unzip -oq data/data55589/WHDLD.zip# 只需要执行一次! mkdir -p Dataset! unzip -oq /home/aistudio/data/data82195/WHDLD-GAN.zip -d Dataset! mv Dataset/color-class.jpg work/  # 这里是要保证数据集文件夹里面干净,所以把类别和配色的对照表移动到work了

*2. 数据集处理

这是将WHDLD数据转化为WHDLD-GAN数据,可以不用运行了,可以使用自己的数据来处理。最后处理好的数据文件应该是这样的

dataset  ├── train  ├── val  └── test

图片需要按照[生成风格, 原始图像]进行拼接

In [ ]

# ! mkdir -p Dataset/train# ! mkdir -p Dataset/val# import os# import random# import cv2# import numpy as np# from tqdm import tqdm# tmp_data_path = 'WHDLD/Images'# save_train_path = 'Dataset/train'# save_val_path = 'Dataset/val'# datas_name = os.listdir(tmp_data_path)# random.shuffle(datas_name)# for idx, data_name in enumerate(tqdm(datas_name)):#     data_path = os.path.join(tmp_data_path, data_name)#     target_path =  data_path.replace('Images', 'ImagesPNG').replace('jpg', 'png')#     data = cv2.imread(data_path)  # 这里也应该转一下RGB,忘记了写,所以红色变成了水,蓝色变成了建筑#     target = cv2.cvtColor(cv2.imread(target_path), cv2.COLOR_BGR2RGB)#     img = np.concatenate((data, target), axis=1)  # 主要就是这里需要将两个图像拼接起来#     save_name = target_path.split('/')[-1]#     if (idx + 1) % 20 != 0:#         cv2.imwrite(os.path.join(save_train_path, save_name), img)#     else:#         cv2.imwrite(os.path.join(save_val_path, save_name), img)# ! rm -rf WHDLD  # 减小空间

3. 开始训练

这里我们使用的是pix2pix模型,只需要在PaddleGAN/configs中新建pix2pix_rs.yaml配置文件,然后将内容填入就好了(内容可以参考这个配置文件),其中几个地方简单一说。

epochs: 200  # 训练轮数output_dir: output_dir  # 保存训练文件的文件夹enable_visualdl: true  # 开启VDLmodel:……  # 不用修改,使用官方提供的pix2pix即可dataset:  train:    name: PairedDataset    dataroot: ../Dataset/train  # 数据集位置,因为数据集在PaddleGAN外面,所以需要../返回父级目录    num_workers: 4  # 不易过大,否则可能报错    batch_size: 1  # 批次大小    ……      test:    name: PairedDataset    dataroot: ../Dataset/test  # 同理    ……lr_scheduler:  # 学习率设置  ……optimizer:  # 生成器和判别器的优化器  ……log_config:  ……snapshot_config:  interval: 5  # 每多少轮保存一次模型参数

3.1 Pix2pix

Pix2pix利用成对的图片进行图像翻译,即输入为同一张图片的两种不同风格,可用于进行风格迁移。Pix2pix是在cGAN的基础上进行改进的,cGAN的生成网络不仅会输入一个噪声图片,同时还会输入一个条件作为监督信息,pix2pix则是把另外一种风格的图像作为监督信息输入生成网络中,这样生成的fake图像就会和作为监督信息的另一种风格的图像相关,从而实现了图像翻译的过程。

Pix2pix的优化目标包含2个部分。一部分是cGAN的优化目标;另一部分是L1距离,用来约束生成图像和真实图像之间的差异,这部分借鉴了其他基于GAN做图像翻译的思想,只不过这里用L1而不是L2,目的是减少生成图像的模糊。

从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成 - 创想鸟

Pix2pix网络结构:

生成器采用U-Net,这是在图像分割领域应用非常广泛的网络结构,能够充分融合特征;而原本GAN中常用的生成器结构是encoder-decoder类型。判别器采用PatchGAN,PatchGAN对输入图像的每个区域(patch)都输出一个预测概率值,相当于从判断输入是真还是假演变成判断输入的N*N大小区域是真还是假。

从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成 - 创想鸟

优点:pix2pix巧妙的利用了GAN的框架来为“Image-to-Image translation”的一类问题提供了通用框架。利用U-Net提升细节,并且利用PatchGAN来处理图像的高频部分。

缺点:训练需要大量的成对图片。

In [2]

%cd PaddleGAN# 恢复训练(想恢复训练需要修改yaml的轮数,因为已经训练到了200轮)# ! python -u tools/main.py --config-file configs/pix2pix_rs.yaml --resume ../data/data82195/epoch_200_checkpoint.pdparams# 重新训练# ! python -u tools/main.py --config-file configs/pix2pix_rs.yaml
/home/aistudio/PaddleGAN

3.2 训练过程

这是训练了8个小时的结果

ppgan.engine.trainer INFO: Epoch: 200/200, iter: 0/4693 lr: 1.980e-06 D_fake_loss: 0.048 D_real_loss: 0.580 G_adv_loss: 4.508 G_L1_loss: 11.564 batch_cost: 0.03402 sec reader_cost: 0.00107 sec ips: 29.39492 images/s eta: 0:00:00

这是VDL看到的生成结果和原始的遥感影像

从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成 - 创想鸟

4. 预测

预测的数据也需要组成拼接的数据,数据的左边随便放点啥。我想不使用配置文件的话应该不用将预测图像也进行拼接,奈何PaddleGAN小白,就先按照这个来吧~需要预测的内容可以自己使用PS等等进行绘制,使用的颜色参考数据集中的color-class.jpg(现在被移动到work目录下了),然后放到test文件夹下就好啦。下面我随便画了两张看看这只神笔能画出怎样的遥感影像~

从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成 - 创想鸟

【左】这是月亮形状的湖在裸地中,周围有几条奇奇怪怪的路。

【右】螺旋形状的路通到一个湖中小岛,岛上被植被包围,中间就一个建筑。

In [3]

! python tools/main.py --config-file configs/pix2pix_rs.yaml --evaluate-only --load ../data/data82195/epoch_200_checkpoint.pdparams
/opt/conda/envs/python35-paddle120-env/lib/python3.7/site-packages/setuptools/depends.py:2: DeprecationWarning: the imp module is deprecated in favour of importlib; see the module's documentation for alternative uses  import imp[04/19 10:38:33] ppgan INFO: Configs: {'epochs': 200, 'output_dir': 'output_dir/pix2pix_rs-2021-04-19-10-38', 'enable_visualdl': True, 'model': {'name': 'Pix2PixModel', 'generator': {'name': 'UnetGenerator', 'norm_type': 'batch', 'input_nc': 3, 'output_nc': 3, 'num_downs': 8, 'ngf': 64, 'use_dropout': False}, 'discriminator': {'name': 'NLayerDiscriminator', 'ndf': 64, 'n_layers': 3, 'input_nc': 6, 'norm_type': 'batch'}, 'direction': 'b2a', 'pixel_criterion': {'name': 'L1Loss', 'loss_weight': 100}, 'gan_criterion': {'name': 'GANLoss', 'gan_mode': 'vanilla'}}, 'dataset': {'train': {'name': 'PairedDataset', 'dataroot': '../Dataset/train', 'num_workers': 4, 'batch_size': 1, 'preprocess': [{'name': 'LoadImageFromFile', 'key': 'pair'}, {'name': 'SplitPairedImage', 'key': 'pair', 'paired_keys': ['A', 'B']}, {'name': 'Transforms', 'input_keys': ['A', 'B'], 'pipeline': [{'name': 'Resize', 'size': [286, 286], 'interpolation': 'bicubic', 'keys': ['image', 'image']}, {'name': 'PairedRandomCrop', 'size': [256, 256], 'keys': ['image', 'image']}, {'name': 'PairedRandomHorizontalFlip', 'prob': 0.5, 'keys': ['image', 'image']}, {'name': 'Transpose', 'keys': ['image', 'image']}, {'name': 'Normalize', 'mean': [127.5, 127.5, 127.5], 'std': [127.5, 127.5, 127.5], 'keys': ['image', 'image']}]}]}, 'test': {'name': 'PairedDataset', 'dataroot': '../Dataset/test', 'num_workers': 4, 'batch_size': 1, 'preprocess': [{'name': 'LoadImageFromFile', 'key': 'pair'}, {'name': 'SplitPairedImage', 'key': 'pair', 'paired_keys': ['A', 'B']}, {'name': 'Transforms', 'input_keys': ['A', 'B'], 'pipeline': [{'name': 'Resize', 'size': [256, 256], 'interpolation': 'bicubic', 'keys': ['image', 'image']}, {'name': 'Transpose', 'keys': ['image', 'image']}, {'name': 'Normalize', 'mean': [127.5, 127.5, 127.5], 'std': [127.5, 127.5, 127.5], 'keys': ['image', 'image']}]}]}}, 'lr_scheduler': {'name': 'LinearDecay', 'learning_rate': 0.0002, 'start_epoch': 100, 'decay_epochs': 100, 'iters_per_epoch': 1}, 'optimizer': {'optimG': {'name': 'Adam', 'net_names': ['netG'], 'beta1': 0.5}, 'optimD': {'name': 'Adam', 'net_names': ['netD'], 'beta1': 0.5}}, 'log_config': {'interval': 100, 'visiual_interval': 500}, 'snapshot_config': {'interval': 5}, 'is_train': False, 'timestamp': '-2021-04-19-10-38'}W0419 10:38:33.788132   523 device_context.cc:362] Please NOTE: device: 0, GPU Compute Capability: 7.0, Driver API Version: 10.1, Runtime API Version: 10.1W0419 10:38:33.793035   523 device_context.cc:372] device: 0, cuDNN Version: 7.6.[04/19 10:38:45] ppgan.engine.trainer INFO: Loaded pretrained weight for net netG[04/19 10:38:45] ppgan.engine.trainer INFO: Loaded pretrained weight for net netD[04/19 10:38:53] ppgan.engine.trainer INFO: Test iter: [0/2]

5. 展示

看看我们瞎画的艺术能生成怎样的遥感影像。

In [5]

import cv2import matplotlib.pyplot as pltdata1 = 'output_dir/pix2pix_rs-2021-04-19-10-38/visual_test/diy0001_real_A.png'target1 = 'output_dir/pix2pix_rs-2021-04-19-10-38/visual_test/diy0001_fake_B.png'data2 = 'output_dir/pix2pix_rs-2021-04-19-10-38/visual_test/diy0002_real_A.png'target2 = 'output_dir/pix2pix_rs-2021-04-19-10-38/visual_test/diy0002_fake_B.png'data1 = cv2.cvtColor(cv2.imread(data1), cv2.COLOR_BGR2RGB)target1 = cv2.cvtColor(cv2.imread(target1), cv2.COLOR_BGR2RGB)data2 = cv2.cvtColor(cv2.imread(data2), cv2.COLOR_BGR2RGB)target2 = cv2.cvtColor(cv2.imread(target2), cv2.COLOR_BGR2RGB)plt.figure(figsize=(10, 10))plt.subplot(221);plt.imshow(data1);plt.title('data')plt.subplot(222);plt.imshow(target1);plt.title('generate')plt.subplot(223);plt.imshow(data2)plt.subplot(224);plt.imshow(target2)plt.show()

代码解释

以上就是从零实践基于PaddleGAN的反向学习分割数据生成遥感图像生成的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/65848.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月12日 03:09:39
下一篇 2025年11月12日 03:38:09

相关推荐

  • 加密货币交易所app下载(2025最新排名)

    在日益数字化的金融世界中,加密货币交易所已成为数字资产交易的核心枢纽。对于希望进入或深化其在加密货币领域参与度的个人而言,选择一个可靠、安全且用户友好的交易平台至关重要。 以下是2025年一些领先的加密货币交易所应用程序的排名: 1. Binance 提供超过数百种加密货币的广泛交易对,满足多样化的…

    2025年12月10日 好文分享
    000
  • 十大虚拟货币交易所排行榜2025最新

    加密货币的世界日新月异,交易平台的竞争也日益激烈。对于广大投资者而言,选择一个安全、稳定、功能齐全的交易平台至关重要。本文将基于2025年的最新数据,为您呈现十大虚拟货币交易所的排行榜,帮助您更好地 navigating the digital asset market. 以下是2025年最新的十大…

    2025年12月10日 好文分享
    000
  • 虚拟货币主流币交易所前十排行榜

    在数字货币飞速发展的今天,选择一个安全、稳定且功能齐全的交易平台至关重要。主流的虚拟货币交易所不仅提供了广泛的交易对,还不断优化用户体验,引进创新功能,以满足日益增长的全球用户需求。这些平台成为了连接投资者与数字资产世界的桥梁,它们在资产安全、交易效率、用户服务等方面展开激烈竞争,共同推动着虚拟货币…

    2025年12月10日 好文分享
    000
  • 2025年哪些AI代币值得关注?

    2025年AI加密市场迎来爆发,总市值达295亿美元,AI代币在去中心化应用中占比18.6%,Bittensor、ASI、NEAR、Render等项目推动基础设施、公链性能与算力网络发展,AI代理预计执行90%链上交易,但需警惕泡沫风险、代理错误及区块链最终性矛盾。 随着人工智能与区块链技术的深度融…

    2025年12月10日
    000
  • ChainOpera AI (COAI) 热度为何飙升?

    近期,加密货币市场的一个现象级项目引起了广泛关注。chainopera ai(代币coai)在短短几周内,其价格从不足0.4美元飙升至超过5.66美元,周涨幅高达1,795%,市值一度突破11亿美元。这款基于bnb智能链的ai代币,成功地将人工智能叙事与病毒式传播相结合,成为了2025年第四季度加密…

    2025年12月10日
    000
  • Peter Brandt分析:比特币(BTC)若未在关键时点见顶,将迎来“戏剧性”价格飙升

    目录 周日是比特币周期的关键日比特币四年周期辩论持续比特币的购买方式有几种?1、交易所购买2、ATM购买3、P2P购买比特币怎么买? 资深交易员Peter Brandt表示,只要比特币在未来几天内不见顶,就有望迎来前所未有的价格发现。 Brandt周三告诉Cointelegraph:”现…

    2025年12月10日 好文分享
    000
  • Pendle($PENDLE)是什么?PENDLE价格分析及2025年预测

    目录 Pendle的概念和特点1.基本结构2. 使用示例3. 多链支持和流动性基础设施4. 治理与代币经济5. 区别点PENDLE 的当前价格和近期趋势2025年市场预测1.保守情景(维持5-6美元)2. 中性情景(上涨 6-8 美元)3. 激进情景(突破 10 美元)PENDLE生长因子1. 扩大…

    2025年12月10日
    000
  • BNB币2025年价格预测:突破历史新高后,BNB会达到$2,000吗?

    目录 BNB Chain 及其原生代币BNB 的代币经济学是什么?BNB 的主要用途包括:是什么推动BNB 在2025 年10 月创下历史新高?1. 链上活动激增,推动BNB 代币销毁创纪录2. 机构采用将BNB 确立为企业储备资产3. BNB Chain 生态系统增长巩固长期基础4. 市场动能和恢…

    2025年12月10日 好文分享
    000
  • 喜讯:稳定币市场飙升至3000亿美元,助力加密市场大涨

    据业内观察人士向Cointelegraph透露,稳定币总供应量突破3000亿美元大关,这一历史性里程碑或将成为点燃加密市场新一轮上涨的“火箭燃料”,同时也反映出加密资产与全球金融系统的深度融合趋势。 多位市场分析人士认为,这3000亿美元的稳定币规模不仅仅是数字上的突破,更意味着越来越多的传统资金正…

    2025年12月10日
    000
  • 10月飙升1000%的ChainOpera AI (COAI)币是什么?代币用途介绍

    目录 ChainOpera AI (COAI) 是什么?如何运作?ChainOpera AI (COAI) 为何在十月初飙升 1,000%?1. 新的上线和针对性奖励引入了流动性2. 关于可衡量贡献的清晰叙事3. 在 TGE 和未来解锁前的定位COAI 代币的用途是什么?COAI 代币经济学与代币分…

    2025年12月10日 好文分享
    000
  • 预警:"掠夺性"交易者挤压比特币多头头寸,BTC恐面临跌至11.4万美元风险

    目录 核心要点:BTC在触及历史高点后进入盘整阶段11.4万美元支撑位再度引发市场关注 比特币价格走势分析显示,在从前期高点回落4%之后,市场正聚焦新的底部目标——11.4万美元,同时交易流动性逐步恢复。 核心要点: BTC价格在数小时内下挫超4%,随后维持低位震荡。市场流动性回暖,预示短期内波动可…

    2025年12月10日 好文分享
    100
  • 什么是DoubleZero (2Z)币?2Z工作原理、代币经济学及价格预测

    目录 关键要点什么是 DoubleZero?DoubleZero创始人DoubleZero 的工作原理带宽贡献网络集成智能合约 主要特点专用带宽边缘过滤优化路线激励模型DoubleZero 使用案例2Z代币代币经济学DoubleZero价格预测DoubleZero 2025 年价格预测DoubleZ…

    2025年12月10日
    000
  • 什么是 Fusionist (ACE)币?ACE代币经济学、未来发展及价格预测

    目录 什么是Fusionist (ACE)?Fusionist 如何运作?Fusionist 有何独特之处?什么是 ACE 代币?ACE 代币经济学Fusionist投资潜力Fusionist价格预测Fusionist 2025 年价格预测Fusionist 2026-2031 年价格预测Fusio…

    2025年12月10日
    000
  • 什么是 Polymesh (POLYX)币?POLYX工作原理、生态系统及价格预测

    目录 介绍什么是 Polymesh?谁是 Polymesh 的创始人?Polymesh 如何工作?  固定多边形网格Polymesh(POLYX)是用来做什么的?POLYX 有什么用途?Polymesh 的费用结构Polymesh 有何独特之处? 治理 身份 遵守保密性沉降POLYX 是什么?  治…

    2025年12月10日
    000
  • 狗狗币合约的只减仓模式如何使用_狗狗币合约的只减仓模式使用指南

    狗狗币合约交易中的“只减仓”模式是一个核心的风险控制功能。它能确保您的订单仅用于减少或关闭现有仓位,有效避免因操作失误而意外增加反向持仓的风险,是交易者的重要工具。 了解只减仓模式的核心作用 1、只减仓是一个特殊的订单指令,其首要目标是帮助交易者进行精确的仓位管理,而非开立新仓位,这对于执行复杂的交…

    2025年12月10日
    000
  • 加密货币的起源

    探索加密货币的起源,我们踏上了一段引人入胜的旅程,深入了解这种颠覆性技术如何从理论构想一步步发展成为全球金融格局中不可或缺的一部分。这不仅仅是关于比特币的故事,更是一个关于匿名理想主义者、密码学突破以及对传统中心化金融系统深刻质疑的故事。理解加密货币的诞生,就如同拨开历史的迷雾,去洞悉一个全新的数字…

    好文分享 2025年12月10日
    000
  • 如何查询虚拟币转账记录?全链路操作指南

    在虚拟货币交易中,查询转账记录是保证资金安全与核对账务的重要环节。本文将为新手用户提供一份全链路操作指南,涵盖从交易所记录到区块链浏览器查询的完整流程。 一、交易所内查看转账记录 绝大多数交易所都会在账户内提供充值/提现记录功能: 登录交易所账户,如币安、火币或欧易OKX。进入“资产”页面,选择“历…

    2025年12月10日
    000
  • 加密货币与DeFi

    在数字经济的浪潮中,加密货币与去中心化金融(defi)作为两大核心支柱,正以前所未有的速度重塑全球金融格局。它们不仅仅是技术概念,更是对传统金融体系的一次深刻反思与颠覆性创新。加密货币作为区块链技术最早、最广为人知的应用,提供了一种无需中心化机构信任背书的数字价值存储和传输方式,其背后蕴含的是数学、…

    好文分享 2025年12月10日
    000
  • 加密货币投资必读

    在数字时代浪潮中,加密货币以其独特的魅力吸引着全球投资者的目光。它不仅仅是一种新兴的金融资产,更代表着底层技术革新——区块链的巨大潜力。然而,如同任何一种投资形式,加密货币市场也充满了机遇与风险。对于希望踏入这片未知领域的投资者而言,掌握必要的知识与策略,规避潜在陷阱,显得尤为重要。本文将深入探讨加…

    好文分享 2025年12月10日
    000
  • 加密货币的种类

    加密货币的世界充满了令人眼花缭乱的数字资产,每一种都承载着独特的技术、经济愿景和社区支持。对于初入此领域的人来说,理解这些多样的加密货币,就如同打开了一个全新的金融维度。它们不仅仅是代码和数字,更是未来金融体系的潜在基石。本文将深入探讨加密货币的各种类型,帮助读者辨别它们之间的差异,了解其核心功能,…

    好文分享 2025年12月10日
    000

发表回复

登录后才能评论
关注微信