当FAIR1M遇上PaddleDetection 2.0

程序猿 • 2025年11月25日 15:22:29 • 科技 • 阅读 0

本文介绍将FAIR1M数据集与PaddleDetection 2.0结合的实践。先处理FAIR1M数据，解压后移除4张测试图，转为COCO格式；再安装PaddleDetection及旋转框算子，选用S2ANet模型，配置相关yml文件后训练，最后用测试图预测。训练有警告，预测角度有偏差，部分bug待修复。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

当FAIR1M遇上PaddleDetection 2.0

FAIR1M数据集1.0版本中包含了超过15000幅分辨率优于1米、尺寸从上千到上万像素不等的图像，其中包含了100多万精细化标注、具有任意角度分布的实例，场景覆盖全球上百个典型城市、乡镇，以及常用机场、港口等。同时根据遥感应用的实际需求，FAIR1M数据集将地物要素和典型目标进一步进行类型的细分。例如，依据型号将飞机细分为波音式（波音737、747、777和787等）、空客式（空客220、321、330和350等）以及国产式飞机（C919和ARJ21等）。目前已发布的FAIR1M数据集1.0版本中一共包含37个精细划分的类别。该数据集建设过程中得到了国家高分辨率对地观测系统重大科技专项支持，并于2021年2月被遴选为ISPRS科学创新项目（2021年度全球共7项），成为该协会高分辨率卫星图像目标识别研究的公开标准数据集。

数据地址：http://gaofen-challenge.com/

PaddleDetection飞桨目标检测开发套件，旨在帮助开发者更快更好地完成检测模型的组建、训练、优化及部署等全开发流程。PaddleDetection模块化地实现了多种主流目标检测算法，提供了丰富的数据增强策略、网络模块组件（如骨干网络）、损失函数等，并集成了模型压缩和跨平台高性能部署能力。目前PaddleDetection已经推出了最新的2.0版本，新增倾斜框的检测、高性价比的PPYOLO新品以及Anchor Free的SOTA模型PAFNet。

github：https://github.com/PaddlePaddle/PaddleDetection

gitee：https://gitee.com/paddlepaddle/PaddleDetection

0. 数据处理

0.1 解压数据集

解压数据集并且换个地方保存，方便自己管理文件。目前在官网下载的FAIR1M貌似只有part1，也就是1700多张图像，然后我看了一下找了四张不太一张的图像，作为我们结果的测试吧，我们把它们从训练数据中删除。

In [ ]

! unzip -oq /home/aistudio/data/data77871/FAIR1M.zip! mkdir -p datasets! mv train/part1/images datasets! mv train/part1/labelXmls datasets! rm -rf train

In [ ]

# 移除用来测试的4张import osimg_path = 'datasets/images'xml_path = 'datasets/labelXmls'names = ['1054.tif', '1066.tif', '1131.tif', '1442.tif']for name in names:    _img = os.path.join(img_path, name)    _xml = os.path.join(xml_path, name.replace('.tif', '.xml'))    if os.path.exists(_img):        os.remove(_img)    if os.path.exists(_xml):        os.remove(_xml)print('ok')

0.2 转换为COCO数据集

由于这个数据集不是标准的VOC格式，然后PaddleDetection的旋转框需要COCO格式的数据集，因此需要想办法转到COCO的格式。因为平时几乎没怎么做检测的任务，那些格式也不太清楚，卡了一下。后来想到一个曲线救国的方法，就是DOTA数据提供了转为COCO的代码，而这个数据集和DOTA的内容有点像（虽然格式啥的完全也不一样）。于是我写了一个fair1m2dota先把数据转为DOTA的数据，再修改dota2coco以此得到需要的COCO数据格式。DOTA 数据集中实例是按照任意四边形标注，最后转换成[xc, yc, bow_w, bow_h, angle]的格式。

In [ ]

! pip -q install shapely# 转化为cocofrom fair1m2coco import func2func2('datasets', 'datasets/train.json')

1. 安装所需

由于旋转框需要额外的算子，所以这里需要安装旋转框的额外算子。

Levity

AI帮你自动化日常任务

206 查看详情 In [ ]

# 克隆paddleDetection# ! git clone https://gitee.com/PaddlePaddle/PaddleDetection.git%cd PaddleDetection# 安装所需要的包! python setup.py install# 安装检测框所需要的算子%cd /home/aistudio/PaddleDetection/ppdet/ext_op! python setup.py install# ! python test.py  # 测试算子

2. S2ANet

目前官方在旋转框上使用的模型为S2ANet模型。感觉除了论文也没多少人解读，检测不是特别懂，就不乱说细节了。

3. 开始训练

在configs中新建自己任务的yml，参考dota的yml，设置好数据路径、轮数等等什么的，就可以开始跑了。

s2anet_fair1m.yml：基本的yml；s2anet_reader.yml：在base下面，这里我啥也没改，参考吖吖查大佬所述，batchsize大于1会报错，还在修复，所以我也保持的1；s2anet.yml：在base下面，网络的一些设置，不太清楚也没怎么改，也就是设置下权重和num_classes；s2anet_optimizer_1x.yml：在base下面，学习率和轮数什么的可以在这里设置；runtime.yml：在上一级，这里可以设置保存间隔和路径等等；dota.yml：在datasets下面，里面需要设置一下数据的路径，需要注意test的anno_path设置为训练的json，否则会使用COCO默认的标签。

然后据吖吖查大佬所述，加上eval会导致报错，所以这里也没有进行验证，只能通过loss来查看训练的如何。

In [ ]

%cd /home/aistudio! mkdir -p /home/aistudio/log%cd PaddleDetection! python tools/train.py -c configs/dota/s2anet_fair1m.yml -o use_gpu=true --use_vdl=True --vdl_log_dir=/home/aistudio/log

有很多这样的警告，我感到莫名其妙，明明都跑起来了，还说框有问题。

ppdet.data.source.coco WARNING: Found an invalid bbox in annotations: im_id: 1318, area: 0.0 x1: -0.5, y1: 96.5, x2: 0.5, y2: 97.5.

训练结果如下：

ppdet.engine INFO: Epoch: [29] [1700/1728] learning_rate: 0.000001 fam_cls_loss: 0.082565 fam_reg_loss: 0.036638 odm_cls_loss: 0.090113 odm_reg_loss: 0.111688 loss: 0.352884 eta: 0:00:06 batch_cost: 0.2364 data_cost: 0.0001 ips: 4.2298 images/s

4. 图像预测

预测的图像不知为何tif就没办法了，只得将jpg的图像放在了test_img中，用于预测，结果都保留在output中。

In [3]

%cd /home/aistudio/PaddleDetection! python tools/infer.py -c configs/dota/s2anet_fair1m.yml     -o weights=output/s2anet_fair1m/model_last.pdparams     --infer_dir=test_img     --draw_threshold=0.5     --output_dir=output

这里显示一下，看看大概的效果。这个图太大了，这样压缩在里面看不太清，可以去output中找到对应的原图。

In [2]

import matplotlib.pyplot as pltimport cv2%matplotlib inlinenames = ['1054.jpg', '1066.jpg', '1131.jpg', '1442.jpg']plt.figure(figsize=(20,20))for i, name in enumerate(names):    img_path = '/home/aistudio/PaddleDetection/output/' + name    img = cv2.cvtColor(cv2.imread(img_path), cv2.COLOR_BGR2RGB)    plt.subplot(2, 2, (i + 1));plt.imshow(img)plt.show()

总结说明

大体看效果还可，总算转起来啦，但是旋转的角度感觉有偏差，应该是在转换中精度有所损失；目前PaddleDetection的旋转框还有点bug在修改，后面肯定会越来越好用的；关于警告数据集的事，实在搞不懂，请教JavaRoom大佬了，有知道的朋友欢迎评论区指导一下；由于发布新版本时PPDet超过了1000个文件，所以把其中的docs、demo、静态的contrib和静态的configs都删除了。

以上就是当FAIR1M遇上PaddleDetection 2.0的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/740857.html

ai coco cos fig git igs python udio

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

基于Paddle2.0的样式校正卷积网络SRM

上一篇 2025年11月25日 15:21:58

『NLG学习』（二）教你搭建自己的Transformer

下一篇 2025年11月25日 15:22:43

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
5000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
2000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
1000
好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

旋转长方形后，如何计算其相对于画布左上角的轴距？

绘制长方形并旋转，计算旋转后轴距在拥有 1920×1080 画布中，放置一个宽高为 200×20 的长方形，其坐标位于 (100, 100)。当以任意角度旋转长方形时，如何计算它相对于画布左上角的 x、y 轴距？以下代码提供了一个计算旋转后长方形轴距的解决方案： const x = 200;co…

程序猿
2025年12月24日
0000
好文分享

旋转长方形后，如何计算它与画布左上角的xy轴距？

旋转后长方形在画布上的xy轴距计算在画布中添加一个长方形，并将其旋转任意角度，如何计算旋转后的长方形与画布左上角之间的xy轴距？问题分解：要计算旋转后长方形的xy轴距，需要考虑旋转对长方形宽高和位置的影响。首先，旋转会改变长方形的长和宽，其次，旋转会改变长方形的中心点位置。求解方法：计算旋…

程序猿
2025年12月24日
0000
好文分享

旋转长方形后如何计算其在画布上的轴距？

旋转长方形后计算轴距假设长方形的宽、高分别为 200 和 20，初始坐标为 (100, 100)，我们将它旋转一个任意角度。根据旋转矩阵公式，旋转后的新坐标 (x’, y’) 可以通过以下公式计算： x’ = x * cos(θ) – y * sin(θ)y’ = x * …

程序猿
2025年12月24日
0000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
0000
好文分享

如何计算旋转后长方形在画布上的轴距？

旋转后长方形与画布轴距计算在给定的画布中，有一个长方形，在随机旋转一定角度后，如何计算其在画布上的轴距，即距离左上角的距离？以下提供一种计算长方形相对于画布左上角的新轴距的方法： const x = 200; // 初始 x 坐标const y = 90; // 初始 y 坐标const w =…

程序猿
2025年12月24日
2000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
2000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

如何计算旋转后的长方形在画布上的 XY 轴距？

旋转长方形后计算其画布xy轴距在创建的画布上添加了一个长方形，并提供其宽、高和初始坐标。为了视觉化旋转效果，还提供了一些旋转特定角度后的图片。问题是如何计算任意角度旋转后，这个长方形的xy轴距。这涉及到使用三角学来计算旋转后的坐标。以下是一个 javascript 代码示例，用于计算旋转后长方…

程序猿
2025年12月24日
0000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000