飞桨常规赛:遥感影像地块分割 – 10月第2名方案

该方案为飞桨遥感影像地块分割赛题10月第2名方案,借鉴榜首模型结构,采用HRNet_W48+OCRNet,loss结合LovaszSoftmax和CrossEntropy。数据集经处理剔除无效样本,用多种增强策略。训练用Momentum优化器等,预测选50轮模型,提分点含数据增强等。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟

飞桨常规赛:遥感影像地块分割

10月第2名方案

赛题

本赛题旨在对遥感影像进行像素级内容解析,并对遥感影像中感兴趣的类别进行提取和分类,以衡量遥感影像地块分割模型在多个类别(如建筑、道路、林地等)上的效果。
数据共包括4种分类,像素值分别为0、1、2、3。此外,像素值255为未标注区域,表示对应区域的所属类别并不确定,在评测中也不会考虑这部分区域。
训练集包含66,653张遥感影像图片和对应的标注图片,测试集包括4,609张遥感影像图片。遥感分辨率均为2m/pixel,图片尺寸均为256*256。
示例图片:
飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟 飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟        

飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟 飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟        

解题思路

主要借鉴了当前榜首(戳这里查看方案)的模型结构,但由于实现细节的差异,分数还是低了不少。
和榜首方案不同的是,个人比较偏好API编程的模式。

模型

模型采用了HRNet_W48+OCRNet,loss采用LovaszSoftmax和CrossEntropy(详见my_model.py)。

backbone = paddleseg.models.backbones.HRNet_W48(pretrained='https://bj.bcebos.com/paddleseg/dygraph/hrnet_w48_ssld.tar.gz', has_se=False)model = paddleseg.models.OCRNet(num_classes=4,backbone=backbone,backbone_indices=[-1],ocr_mid_channels=512,ocr_key_channels=256, pretrained='https://bj.bcebos.com/paddleseg/dygraph/ccf/fcn_hrnetw48_rs_256x256_160k/model.pdparams')

       

ce_coef = 1.0lovasz_coef = 0.3main_loss = lovasz_coef*self.lovasz(yp[0], yt)+ce_coef*self.ce(yp[0], yt)soft_loss = lovasz_coef*self.lovasz(yp[1], yt)+ce_coef*self.ce(yp[1], yt)return 1.0*main_loss+0.4*soft_loss

   

数据集

数据集采用了paddle.io.Dataset包装,方便采用paddle.io.DataLoader实现组batch和并行预处理,能够提高训练效率。

在数据集中调用paddle.vision.transforms实现数据增强,采用的增强策略有颜色抖动、随机旋转、随机翻转、随机crop等。

另外,发现训练集中有大约5000余张样本对应的标签完全由255组成,他们对训练不会有任何收益,故构造数据集时将相应的样本剔除。

代码详见my_dataset.py

训练策略

优化器为Momentum,学习率策略为PolynomialDecay和LinearWarmup。其他训练参数为:

BATCH_SIZE = 32LR = 1e-3WARMUP_EPOCH = 10 # warmup轮数TRAIN_EPOCHS = 40 # 训练轮数EVAL_EPOCH = 2 # 每两轮验证一次

       

训练主函数见train.py

学习率变化曲线飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟loss曲线飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟miou曲线飞桨常规赛:遥感影像地块分割 - 10月第2名方案 - 创想鸟        

预测

训练时有一个很奇怪的现象,验证集的miou曲线是一个先降后升的’U’型。采用验证集最优模型的话,提交结果不如最后一轮,所以预测时加载的模型是训练50轮的参数。

预测时使用with paddle.no_grad():或者@paddle.no_grad()装饰器可以在推理时不保存中间结果,节省巨量显存。当然AI Studio的V100显卡太强了,有没有都无所谓。

推理时把数据集用DataLoader包装一下可以更好的并行。

预测后在左侧直接右键result文件夹,选择’打包下载’即可直接下载zip压缩包,可以直接在比赛页面提交。奇怪,前两天用的时候好像还是英文’Download as zip archive’,现在就变成中文了。

具体代码见predict.py。

代码说明

代码都放在work文件夹下,结果也都保存在work/result文件夹下,模型保存在models文件夹下。

文件 内容

configs.py全局参数设置my_dataset.py构造数据集my_model.py构造模型predict.py预测并保存结果train.py训练模型utils.py一些工具函数

模块文件下都通过

if __name__=='__main__':    ...

       

的形式编写了一些测试语句,方便调试。

总结

四月份的时候参加过一轮,当时手攒了个模型,没有利用好paddleseg这个好用的套件,分数很低,该做好的点没有做好。感觉提分点主要有以下这些吧:

数据增强。一般来说,常规的数据增强都会有些效果,也可以根据数据的特点进行一定的取舍;SOTA模型。自己攒模型一般还是不如用现成的,尤其是对于新手。学到一定程度以后可以看看源码对比一下论文,说不定以后自己也能提出一些改进呢;预训练模型。不多说了,有没有预训练简直是两个模型;结果后处理。按之前的经验,语义分割类的结果做个滤波会有一点点不大的提升;另外,TTA据说很强。这里我还没来得及试。
           

和榜首的差距可能主要还是在数据增强策略上,另外,自己用API手写的训练过程可能还是有些细节上没实现好,还需要多学习学习。

一键复现

In [ ]

# 安装paddleseg和解压数据集。!pip install paddleseg==2.3.0!cd data/data77571/ && unzip -q train_and_label.zip!cd data/data77571/ && unzip -q img_test.zip

   In [ ]

# 训练!cd work && python train.py

   In [ ]

# 预测!cd work && python predict.py

   

以上就是飞桨常规赛:遥感影像地块分割 – 10月第2名方案的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/51480.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 22:31:03
下一篇 2025年11月8日 22:35:35

相关推荐

  • php学哪些语言

    有效使用 PHP 需掌握以下语言技能:HTML 和 CSS,用于构建用户界面;SQL,用于与数据库交互;JavaScript,用于增强客户端交互;其他服务器端语言,以了解概念和集成组件;PHP 框架,以提高开发效率和可维护性;版本控制系统,以管理代码更改。 PHP 所需掌握的语言 PHP (Hype…

    2025年12月12日
    000
  • php需要掌握哪些

    PHP入门需掌握:基础语法(数据类型、运算符、控制结构、循环结构、函数)、MVC架构、数据库交互、面向对象编程、Web开发(HTTP协议、HTML/CSS/JavaScript、框架)、调试和错误处理、安全实践、持续集成和部署,以及其他编程语言、Unix/Linux命令行和文档/版本控制基础。 PH…

    2025年12月12日
    000
  • php包含哪些语言

    PHP 是一种通用脚本语言,用于创建动态 Web 应用程序,包含以下特性:嵌入 HTML 和 CSS与数据库交互与 JavaScript 集成XML 处理正则表达式支持可与其他脚本语言一起使用 PHP 中包含的语言 PHP 是一种流行的通用脚本语言,用于创建动态 Web 应用程序。它包含多种语言特性…

    2025年12月12日
    000
  • 想学php需要哪些基础

    学习 PHP 需要具备以下基础: HTML 和 CSS、编程基础、数据库基础、版本控制、操作系统、对 Web 开发的兴趣以及解决问题的技能。 想学 PHP 需要哪些基础? 要学习 PHP,需要具备以下基础: 1. HTML 和 CSS 了解 HTML 结构和语义掌握 CSS 元素样式和布局 2. 编…

    2025年12月12日
    000
  • 框架扩展机制的优点和缺点

    框架扩展机制允许开发人员通过创建模块和插件来扩展其功能,提供灵活性、可定制性和可重用性。它还促进了社区支持和丰富的扩展生态系统。然而,扩展机制也带来了复杂性、性能开销、兼容性问题和安全隐患。实战案例展示了使用 django 框架的扩展机制,允许开发人员创建自定义模板标签以扩展框架功能。 框架扩展机制…

    2025年12月12日
    000
  • php哪些需求做不了

    PHP 无法满足高性能要求、实时处理、移动开发、并发性和可扩展性、严格类型检查、跨平台支持以及复杂数据结构处理等需求。 PHP 无法满足哪些需求 PHP 虽然是一种功能强大的脚本语言,但在某些情况下它并不是理想的选择。以下是一些 PHP 无法满足的需求: 1. 极高的性能要求 虽然 PHP 的性能已…

    2025年12月12日
    000
  • php可以嵌入哪些语言

    PHP 可嵌入多种语言,包括 HTML、CSS、JavaScript、XML 等核心语言,以及 Python、Ruby 等其他语言。通过嵌入这些语言,PHP 可以扩展其自身功能,用于动态生成 web 页面、控制页面样式、添加交互性、生成结构化数据等任务。 PHP 可嵌入的语言 PHP 是一种广泛使用…

    2025年12月12日
    000
  • 学php有哪些好处

    PHP 的优势包括:易学性:语法简单,易于上手。广泛应用:广泛用于创建后端 Web 应用程序。开源和免费:可自由下载、修改和分发。数据库集成:与流行数据库无缝集成,简化数据管理。OOP 支持:可重用代码和组织应用程序,提高可维护性。Web 框架支持:提供构建 Web 应用程序所需工具和功能。社区支持…

    2025年12月12日
    000
  • php的魅力有哪些

    PHP 具有诸多优势,包括:开源和免费广泛的社区支持强大的生态系统易于学习和使用可扩展性和灵活性性能优化与其他语言的集成广泛的应用程序范围高安全性持续的发展 PHP 的魅力 PHP 作为一种流行的编程语言,拥有众多优势,使其备受开发者青睐。 1. 开源和免费 PHP 是开源软件,任何人都可以免费下载…

    2025年12月12日
    000
  • php面试问哪些问题

    在PHP面试中,常见问题涵盖核心PHP知识、数据库交互、框架和工具、安全、版本控制和团队协作以及其他问题,涉及广泛的PHP技能和知识评估。 PHP面试常见问题 在PHP面试中,面试官通常会询问一系列问题来评估候选人的技能和知识。以下列出一些常见问题: 核心PHP知识 解释PHP中面向对象编程的概念。…

    2025年12月12日
    000
  • 贝莱德表示,随着IBIT资产管理规模逼近1000亿美元,Bitcoin目前已位居营收榜首

    币安(Binance) OKX欧易️ 火币(Huobi)️ 据贝莱德巴西区业务拓展主管克里斯蒂亚诺·卡 斯 特 罗 表示,目前公司从比特币现货ETF中获取的收益,已超越旗下所有其他金融产品的表现。 他指出,贝莱德旗下的比特币主题基金当前在收入贡献方面位居榜首。需要强调的是,该公司在全球范围内管理着逾…

    2025年12月12日
    000
  • 什么是ETF杠杆代币?如何交易?Gate交易ETF杠杆代币的图文教程(APP/网页端)

    币安 Binance OKX 欧易 ️ 火币 Huobi️ 什么是 ETF 杠杆代币? etf 杠杆代币是一种借助期货合约等衍生工具构建的指数型产品,旨在精准追踪某一数字资产现货价格变动,并按固定倍数(如3倍、5倍)放大其涨跌幅。该类产品将杠杆功能内嵌于代币结构中,用户无需缴纳保证金、不面临强制平仓…

    2025年12月12日 好文分享
    000
  • Humanity Protocol(H)币是什么?如何购买?H代币经济与价格预测

    当 ai 已经聪明到可以模仿你的声音、生成你的头像,甚至冒充你与他人对话时,一个问题开始频繁出现:在数字世界里,我们要如何证明“我真的在这里”?就在这样的时代背景下,humanity protocol 站了出来,而且恰逢其时。它给出的方案既直观又突破传统,不依赖容易伪造的密码、验证码或身份文件,而是…

    2025年12月12日 好文分享
    100
  • 什么是PIEVERSE币?值得购买吗?PIEVERSE主要功能、运作方式及代币经济学

    Binance币安 欧易OKX ️ Huobi火币️ 摘要 Pieverse旨在重新定义数字经济中的时间估值和货币化。总供应量为10亿枚PIEVERSE代币,目前流通量为1.75亿枚。24小时交易量为9,654.2619万美元,仅在CoinEx上交易。主要功能包括质押、治理和生产力目标奖励。最近的合…

    2025年12月12日
    000
  • 什么是未平仓合约?如何运作?一文详解未平仓合约常见情景与重要性

    未平仓合约是唯一能够显示加密货币衍生品市场在任何特定时间实际锁定资金量的指标。 Binance币安 欧易OKX ️ Huobi火币️ 未平仓合约(OI)出现在大多数期货和永续合约交易平台上。该指标能够准确反映市场中每时每刻实际锁定的资金量,已成为评估价格趋势真实强度的重要工具。 未平仓合约形成的定义…

    2025年12月12日 好文分享
    100
  • 什么是柚子币(EOS)?EOS价格预测2025-2030

    柚子币(eos)是专为支撑大规模去中心化应用(dapps)而构建的区块链平台,采用委托权益证明(dpos)共识机制与零手续费的资源分配模型,致力于实现超高吞吐量与极致用户体验;其2025至2030年间的价格演化路径,将深度绑定于核心技术迭代、生态扩张节奏及行业竞争格局变化,虽具备显著增长潜质,但也需…

    2025年12月12日
    000
  • 什么是菱形形态? 如何在交易中使用? 优缺点介绍

    在加密世界中有许多不同的形态可以帮助交易者达成更理想的交易成果。本文将介绍“菱形形态(diamond pattern)”:它是什么、长什么样、以及如何在交易中使用。开始吧! Binance币安 欧易OKX ️ Huobi火币️ 什么是菱形形态? 菱形形态是一种少见的趋势反转结构,由价格先呈现高低点同…

    2025年12月12日
    000
  • 什么是以太坊Fusaka升级?2025年以太坊扩容的完整新手指南

    Fusaka升级是2025年以太坊扩容关键步骤,核心为引入Verkle树替代默克尔·帕特里夏树,实现无状态和增强Layer 2支持,降低节点硬件门槛并提升去中心化。 以太坊fusaka升级是继prague/electra之后的一个重要规划,其核心是引入verkle树以优化状态管理。这是2025年以太…

    2025年12月12日
    000
  • 如何从币安交易所提币至imKey?提币操作步骤和注意事项

    从币安提币至imKey需四步:一、在imKey App中选择资产并复制收款地址;二、币安提现页粘贴地址并选对应资产;三、严格匹配提币网络与地址链类型;四、完成多重安全验证后查收到账。 从币安交易所提币至imkey硬件设备,核心是先在imkey应用内获取正确的收款地址,然后在币安平台填写该地址并选择匹…

    2025年12月12日
    000
  • MOON币是什么?值得投资吗?MOON币价格预测指南

    MOON币是Reddit r/CryptoCurrency社区的ERC-20积分代币,基于Arbitrum Nova链,用于奖励Karma贡献、打赏、会员购买及治理投票;其价值取决于社区活跃度、代币经济、治理参与和流动性,并需结合Karma分配比率、链上数据与社交媒体情绪综合分析。 moon币是re…

    2025年12月12日
    000

发表回复

登录后才能评论
关注微信