当FAIR1M遇上PaddleDetection 2.0

本文介绍将FAIR1M数据集与PaddleDetection 2.0结合的实践。先处理FAIR1M数据,解压后移除4张测试图,转为COCO格式;再安装PaddleDetection及旋转框算子,选用S2ANet模型,配置相关yml文件后训练,最后用测试图预测。训练有警告,预测角度有偏差,部分bug待修复。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

当fair1m遇上paddledetection 2.0 - 创想鸟

当FAIR1M遇上PaddleDetection 2.0

FAIR1M数据集1.0版本中包含了超过15000幅分辨率优于1米、尺寸从上千到上万像素不等的图像,其中包含了100多万精细化标注、具有任意角度分布的实例,场景覆盖全球上百个典型城市、乡镇,以及常用机场、港口等。同时根据遥感应用的实际需求,FAIR1M数据集将地物要素和典型目标进一步进行类型的细分。例如,依据型号将飞机细分为波音式(波音737、747、777和787等)、空客式(空客220、321、330和350等)以及国产式飞机(C919和ARJ21等)。目前已发布的FAIR1M数据集1.0版本中一共包含37个精细划分的类别。该数据集建设过程中得到了国家高分辨率对地观测系统重大科技专项支持,并于2021年2月被遴选为ISPRS科学创新项目(2021年度全球共7项),成为该协会高分辨率卫星图像目标识别研究的公开标准数据集。

数据地址:http://gaofen-challenge.com/

当FAIR1M遇上PaddleDetection 2.0 - 创想鸟        

PaddleDetection飞桨目标检测开发套件,旨在帮助开发者更快更好地完成检测模型的组建、训练、优化及部署等全开发流程。PaddleDetection模块化地实现了多种主流目标检测算法,提供了丰富的数据增强策略、网络模块组件(如骨干网络)、损失函数等,并集成了模型压缩和跨平台高性能部署能力。目前PaddleDetection已经推出了最新的2.0版本,新增倾斜框的检测、高性价比的PPYOLO新品以及Anchor Free的SOTA模型PAFNet。

github:https://github.com/PaddlePaddle/PaddleDetection

gitee:https://gitee.com/paddlepaddle/PaddleDetection

0. 数据处理

0.1 解压数据集

解压数据集并且换个地方保存,方便自己管理文件。目前在官网下载的FAIR1M貌似只有part1,也就是1700多张图像,然后我看了一下找了四张不太一张的图像,作为我们结果的测试吧,我们把它们从训练数据中删除。

In [ ]

! unzip -oq /home/aistudio/data/data77871/FAIR1M.zip! mkdir -p datasets! mv train/part1/images datasets! mv train/part1/labelXmls datasets! rm -rf train

   In [ ]

# 移除用来测试的4张import osimg_path = 'datasets/images'xml_path = 'datasets/labelXmls'names = ['1054.tif', '1066.tif', '1131.tif', '1442.tif']for name in names:    _img = os.path.join(img_path, name)    _xml = os.path.join(xml_path, name.replace('.tif', '.xml'))    if os.path.exists(_img):        os.remove(_img)    if os.path.exists(_xml):        os.remove(_xml)print('ok')

   

0.2 转换为COCO数据集

由于这个数据集不是标准的VOC格式,然后PaddleDetection的旋转框需要COCO格式的数据集,因此需要想办法转到COCO的格式。因为平时几乎没怎么做检测的任务,那些格式也不太清楚,卡了一下。后来想到一个曲线救国的方法,就是DOTA数据提供了转为COCO的代码,而这个数据集和DOTA的内容有点像(虽然格式啥的完全也不一样)。于是我写了一个fair1m2dota先把数据转为DOTA的数据,再修改dota2coco以此得到需要的COCO数据格式。DOTA 数据集中实例是按照任意四边形标注,最后转换成[xc, yc, bow_w, bow_h, angle]的格式。

In [ ]

! pip -q install shapely# 转化为cocofrom fair1m2coco import func2func2('datasets', 'datasets/train.json')

   

1. 安装所需

由于旋转框需要额外的算子,所以这里需要安装旋转框的额外算子。

Levity Levity

AI帮你自动化日常任务

Levity 206 查看详情 Levity In [ ]

# 克隆paddleDetection# ! git clone https://gitee.com/PaddlePaddle/PaddleDetection.git%cd PaddleDetection# 安装所需要的包! python setup.py install# 安装检测框所需要的算子%cd /home/aistudio/PaddleDetection/ppdet/ext_op! python setup.py install# ! python test.py  # 测试算子

   

2. S2ANet

目前官方在旋转框上使用的模型为S2ANet模型。感觉除了论文也没多少人解读,检测不是特别懂,就不乱说细节了。

当FAIR1M遇上PaddleDetection 2.0 - 创想鸟        

3. 开始训练

在configs中新建自己任务的yml,参考dota的yml,设置好数据路径、轮数等等什么的,就可以开始跑了。

s2anet_fair1m.yml:基本的yml;s2anet_reader.yml:在base下面,这里我啥也没改,参考吖吖查大佬所述,batchsize大于1会报错,还在修复,所以我也保持的1;s2anet.yml:在base下面,网络的一些设置,不太清楚也没怎么改,也就是设置下权重和num_classes;s2anet_optimizer_1x.yml:在base下面,学习率和轮数什么的可以在这里设置;runtime.yml:在上一级,这里可以设置保存间隔和路径等等;dota.yml:在datasets下面,里面需要设置一下数据的路径,需要注意test的anno_path设置为训练的json,否则会使用COCO默认的标签。

然后据吖吖查大佬所述,加上eval会导致报错,所以这里也没有进行验证,只能通过loss来查看训练的如何。

In [ ]

%cd /home/aistudio! mkdir -p /home/aistudio/log%cd PaddleDetection! python tools/train.py -c configs/dota/s2anet_fair1m.yml -o use_gpu=true --use_vdl=True --vdl_log_dir=/home/aistudio/log

   

有很多这样的警告,我感到莫名其妙,明明都跑起来了,还说框有问题。

ppdet.data.source.coco WARNING: Found an invalid bbox in annotations: im_id: 1318, area: 0.0 x1: -0.5, y1: 96.5, x2: 0.5, y2: 97.5.

       

训练结果如下:

ppdet.engine INFO: Epoch: [29] [1700/1728] learning_rate: 0.000001 fam_cls_loss: 0.082565 fam_reg_loss: 0.036638 odm_cls_loss: 0.090113 odm_reg_loss: 0.111688 loss: 0.352884 eta: 0:00:06 batch_cost: 0.2364 data_cost: 0.0001 ips: 4.2298 images/s

   

4. 图像预测

预测的图像不知为何tif就没办法了,只得将jpg的图像放在了test_img中,用于预测,结果都保留在output中。

In [3]

%cd /home/aistudio/PaddleDetection! python tools/infer.py -c configs/dota/s2anet_fair1m.yml     -o weights=output/s2anet_fair1m/model_last.pdparams     --infer_dir=test_img     --draw_threshold=0.5     --output_dir=output

   

这里显示一下,看看大概的效果。这个图太大了,这样压缩在里面看不太清,可以去output中找到对应的原图。

In [2]

import matplotlib.pyplot as pltimport cv2%matplotlib inlinenames = ['1054.jpg', '1066.jpg', '1131.jpg', '1442.jpg']plt.figure(figsize=(20,20))for i, name in enumerate(names):    img_path = '/home/aistudio/PaddleDetection/output/' + name    img = cv2.cvtColor(cv2.imread(img_path), cv2.COLOR_BGR2RGB)    plt.subplot(2, 2, (i + 1));plt.imshow(img)plt.show()

       

               

总结说明

大体看效果还可,总算转起来啦,但是旋转的角度感觉有偏差,应该是在转换中精度有所损失;目前PaddleDetection的旋转框还有点bug在修改,后面肯定会越来越好用的;关于警告数据集的事,实在搞不懂,请教JavaRoom大佬了,有知道的朋友欢迎评论区指导一下;由于发布新版本时PPDet超过了1000个文件,所以把其中的docs、demo、静态的contrib和静态的configs都删除了。

以上就是当FAIR1M遇上PaddleDetection 2.0的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/740857.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月25日 15:21:58
下一篇 2025年11月25日 15:22:43

相关推荐

  • 加密货币的起源

    探索加密货币的起源,我们踏上了一段引人入胜的旅程,深入了解这种颠覆性技术如何从理论构想一步步发展成为全球金融格局中不可或缺的一部分。这不仅仅是关于比特币的故事,更是一个关于匿名理想主义者、密码学突破以及对传统中心化金融系统深刻质疑的故事。理解加密货币的诞生,就如同拨开历史的迷雾,去洞悉一个全新的数字…

    好文分享 2025年12月10日
    000
  • 如何查询虚拟币转账记录?全链路操作指南

    在虚拟货币交易中,查询转账记录是保证资金安全与核对账务的重要环节。本文将为新手用户提供一份全链路操作指南,涵盖从交易所记录到区块链浏览器查询的完整流程。 一、交易所内查看转账记录 绝大多数交易所都会在账户内提供充值/提现记录功能: 登录交易所账户,如币安、火币或欧易OKX。进入“资产”页面,选择“历…

    2025年12月10日
    000
  • 加密货币与DeFi

    在数字经济的浪潮中,加密货币与去中心化金融(defi)作为两大核心支柱,正以前所未有的速度重塑全球金融格局。它们不仅仅是技术概念,更是对传统金融体系的一次深刻反思与颠覆性创新。加密货币作为区块链技术最早、最广为人知的应用,提供了一种无需中心化机构信任背书的数字价值存储和传输方式,其背后蕴含的是数学、…

    好文分享 2025年12月10日
    000
  • 加密货币投资必读

    在数字时代浪潮中,加密货币以其独特的魅力吸引着全球投资者的目光。它不仅仅是一种新兴的金融资产,更代表着底层技术革新——区块链的巨大潜力。然而,如同任何一种投资形式,加密货币市场也充满了机遇与风险。对于希望踏入这片未知领域的投资者而言,掌握必要的知识与策略,规避潜在陷阱,显得尤为重要。本文将深入探讨加…

    好文分享 2025年12月10日
    000
  • 加密货币的种类

    加密货币的世界充满了令人眼花缭乱的数字资产,每一种都承载着独特的技术、经济愿景和社区支持。对于初入此领域的人来说,理解这些多样的加密货币,就如同打开了一个全新的金融维度。它们不仅仅是代码和数字,更是未来金融体系的潜在基石。本文将深入探讨加密货币的各种类型,帮助读者辨别它们之间的差异,了解其核心功能,…

    好文分享 2025年12月10日
    000
  • 从币安人生到生态扩张,CZ在AMA中透露了哪些信息?

    10 月 8 日,cz 罕见亮相 trust wallet 举办的「bnb super cycle」ama,与 aster、four.meme、pancake 等 bnb 核心项目同台。 CZ 在 AMA 中正面回应了近期 BNB Chain 生态的热门话题,也分享了他对加密行业未来趋势的深层判断与…

    2025年12月10日
    000
  • Hyperliquid陷“四面楚歌”:王座失守与绝地反击

    目录 凛冬已至:失守的王座与“数据黑洞”组合拳反击:文化、基建与生态的三板斧护城河之辩:喧嚣过后,Hyperliquid还剩下什么? hyperliquid作为去中心化衍生品交易所近期面临严峻挑战,市场份额被竞争对手aster大幅挤压,同时生态内安全事件频发,稳定币计划尚未成熟。面对竞争,hyper…

    2025年12月10日 好文分享
    000
  • 2025 年底即将推出的加密货币有哪些?最佳新加密项目介绍

    目录 关键要点所有项目即将推出在蓬勃发展的加密货币中应该寻找什么上月最新推出的项目常见问题解答最有前途的新加密货币是什么?哪个加密项目最有潜力?哪种加密货币将在 2025 年实现 1000 倍增长?哪种加密货币将在 2025 年实现 1000 倍增长? 2025年,加密货币市场新项目层出不穷。每周都…

    2025年12月10日
    000
  • 卡尔达诺 (ADA)币价格预测:ETF 批准最终会将ADA推高至1 美元以上吗?

    目录 ADA币是什么?ADA(爱达币)基本资讯表卡尔达诺(ADA)市场概览:价格趋势和投资者展望ETF 即将获批——它会改变游戏规则吗?Cardano 的链上升级和生态系统路线图专家对卡尔达诺(ADA)的看法:谨慎乐观还是过度炒作?卡尔达诺 (ADA) 2025 年 10 月展望:看涨、中性还是看跌…

    2025年12月10日
    000
  • 一文了解灰度(Grayscale)质押1.5亿美元以太币(ETH),行业聚焦山寨币ETP审批潮

    在即将迎来美国证券交易委员会(SEC)对多个山寨币ETP申请的关键审批节点之际,灰度(Grayscale)宣布为其首只提供质押收益的美国加密货币交易所交易产品(ETP)完成大规模以太币质押,金额高达1.5亿美元。 这家专注于数字资产的资产管理公司于周一完成了对32,000枚以太币(ETH)的质押操作…

    2025年12月10日
    000
  • 一文详细了解越南央行预计在加密货币快速普及背景下信贷将增长

    根据Chainalysis发布的最新数据,越南已成为亚太地区加密货币采用率最高的国家之一,全球排名第四,展现出强劲的数字资产发展势头。 在这一背景下,越南国家银行(State Bank of Vietnam)预计2025年信贷增长将达到约20%。这一高增长预期可能为市场注入更多流动性,进一步推动资金…

    2025年12月10日
    000
  • 以太坊(ETH)基金会将1000枚ETH兑换为稳定币,用于研发和资助

    以太坊基金会(Ethereum Foundation,EF)近日通过去中心化交易协议CoW Swap完成了一笔涉及1,000枚ETH的兑换操作,将其转换为稳定币。此举旨在支持基金会的研发支出、拨款发放以及对DeFi项目的持续投资,属于其整体国库管理策略的一部分。 按当前市场价格估算,此次交易价值约为…

    2025年12月10日
    000
  • Syndicate(SYND)币是什么?怎么样?Syndicate技术架构、代币经济及风险分析

    目录 Syndicate概述为什么应用链需要可编程序列器Syndicate 的目标用户核心技术与架构智能排序器和“智能汇总”原子可组合性和可升级性时间线和生态系统进展生态系统协调和流动性引导SYND 代币和经济分配:SYND 实用性和价值捕获市场可用性和基本指标生态系统进展社区互联网路径支持经济方面…

    2025年12月10日
    000
  • Plasma(XPL)币价格预测2025-2030年 : XPL币能否复制 Tether 的增长路径?

    目录  Plasma (XPL) 是什么?如何运作?XPL 代币有什么用途?Plasma (XPL) 代币经济学概览Plasma (XPL) 的风险和挑战零费用模式的可持续性监管风险竞争格局技术安全风险Plasma (XPL) 的前景2025-2030年等离子(XPL)价格预测等离子(XPL)202…

    2025年12月10日
    000
  • KuCoin:山寨币天堂

    kucoin是什么?它为何被称为“山寨币天堂”? KuCoin是一个全球性的加密货币交易所,成立于2017年9月。它提供现货交易、杠杆交易、合约交易、质押、借贷等多种服务。之所以被称为“山寨币天堂”,主要有以下几个原因: 广泛的币种选择: KuCoin以其惊人的币种数量而闻名。除了比特币(BTC)和…

    好文分享 2025年12月10日
    000
  • TXID全解:如何利用区块链交易ID追踪加密交易

    TXID(交易ID)是链上交易的唯一识别码,本文将为您做一个完整解读:解释什么是TXID、如何用它追踪交易状态、排查失败原因并提供实操步骤,帮助新手快速上手链上查询与问题定位。 什么是TXID?核心概念 TXID即交易哈希,是区块链为每笔交易生成的唯一字符串(例如以太坊或比特币交易的哈希值),用于在…

    2025年12月10日
    000
  • 比特币概念股是什么?都有哪些值得关注的公司?

    随着比特币(BTC)及加密货币市场的发展,越来越多比特币概念股成为投资者关注的焦点。这类公司通常涉及比特币挖 矿、持仓或区块链技术应用,其股价往往与比特币价格走势相关联。 值得关注的比特币概念股 以下为市场上具有代表性的比特币概念股: MicroStrategy(MSTR):企业持有大量比特币,是典…

    2025年12月10日
    000
  • Bitfinex:专业交易

    在加密货币交易的浩瀚宇宙中,bitfinex无疑是其中一颗耀眼的星辰。它不仅仅是一个简单的交易所,更是一个为专业交易者量身定制的复杂生态系统。踏入bitfinex的大门,你将发现一个集高流动性、先进交易工具、深度市场数据以及强大安全保障于一体的交易殿堂。这里汇聚了全球顶级的机构投资者、资深交易员以及…

    好文分享 2025年12月10日
    000
  • Chainbase币投资价值怎么样

    在加密货币市场持续演进的背景下,chainbase币正逐步吸引越来越多投资者的关注。 从技术层面来看,chainbase币依托于创新的区块链架构,展现出显著的去中心化优势。其系统通过分布式账本技术保障了交易数据的高度透明与不可篡改性,为用户资产安全提供了强有力的支撑。这种结构不仅提升了网络的整体稳定…

    2025年12月10日
    000
  • 什么是虚拟币买卖_虚拟币买卖入门基础知识详解

    虚拟币买卖,本质上是在数字资产交易平台上,通过买入和卖出不同种类的虚拟资产来赚取价格差额的行为。本文将系统地介绍虚拟币买卖的基础知识,帮助新手建立一个清晰的认知框架,了解其核心运作方式和关键概念。 虚拟币买卖入门平台推荐 1、欧易okx 官网入口: APP下载链接: 2、币安Binance 官网入口…

    2025年12月10日
    000

发表回复

登录后才能评论
关注微信