基于PaddlePaddle复现的CycleMLP

本文提出了一个简单的 MLP-like 的架构 CycleMLP,它是视觉识别和密集预测的通用主干,不同于现代 MLP 架构,例如 MLP-Mixer、ResMLP 和 gMLP,其架构与图像大小相关,因此是在目标检测和分割中不可行。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

基于paddlepaddle复现的cyclemlp - 创想鸟

1. 简介

这是一个PaddlePaddle实现的CycleMLP。

本文提出了一个简单的 MLP-like 的架构 CycleMLP,它是视觉识别和密集预测的通用主干,不同于现代 MLP 架构,例如 MLP-Mixer、ResMLP 和 gMLP,其架构与图像大小相关,因此是在目标检测和分割中不可行。

基于PaddlePaddle复现的CycleMLP - 创想鸟

论文: CycleMLP: A MLP-like Architecture for Dense Prediction

参考repo: CycleMLP

在此非常感谢ShoufaChen贡献的CycleMLP,提高了本repo复现论文的效率。

2. 数据集和复现精度

数据集为ImageNet,训练集包含1281167张图像,验证集包含50000张图像。

│imagenet/├──train/│  ├── n01440764│  │   ├── n01440764_10026.JPEG│  │   ├── n01440764_10027.JPEG│  │   ├── ......│  ├── ......├──val/│  ├── n01440764│  │   ├── ILSVRC2012_val_00000293.JPEG│  │   ├── ILSVRC2012_val_00002138.JPEG│  │   ├── ......│  ├── ......

您可以从ImageNet 官网申请下载数据。

模型 top1 acc (参考精度) top1 acc (复现精度) 权重 | 训练日志

CycleMLP-B10.7890.790checkpoint-best.pd | train.log

权重及训练日志下载地址:百度网盘

3. 准备数据与环境

3.1 准备环境

硬件和框架版本等环境的要求如下:

硬件:4 * RTX3090框架:PaddlePaddle >= 2.2.0安装paddlepaddle

# 需要安装2.2及以上版本的Paddle,如果# 安装GPU版本的Paddlepip install paddlepaddle-gpu==2.2.0# 安装CPU版本的Paddlepip install paddlepaddle==2.2.0

更多安装方法可以参考:Paddle安装指南。

下载代码In [ ]

%cd /home/aistudio!git clone https://github.com/flytocc/CycleMLP-paddle.git

安装requirementsIn [ ]

%cd /home/aistudio/CycleMLP-paddle!pip install -r requirements.txt

3.2 准备数据

如果您已经ImageNet1k数据集,那么该步骤可以跳过,如果您没有,则可以从ImageNet官网申请下载。

4. 复现思路

4.1 使用paddle api实现模型结构

CycleFC模块

与现代方法相比,CycleMLP 有两个优势。

(1) 可以应对各种图像尺寸。

(2) 利用局部窗口实现对图像大小的线性计算复杂度。

基于PaddlePaddle复现的CycleMLP - 创想鸟

class CycleFC(nn.Layer):    def __init__(        self,        in_channels: int,        out_channels: int,        kernel_size,  # re-defined kernel_size, represent the spatial area of staircase FC        stride: int = 1,        padding: int = 0,        dilation: int = 1,        groups: int = 1,        bias: bool = True,    ):        super(CycleFC, self).__init__()        if in_channels % groups != 0:            raise ValueError('in_channels must be divisible by groups')        if out_channels % groups != 0:            raise ValueError('out_channels must be divisible by groups')        if stride != 1:            raise ValueError('stride must be 1')        if padding != 0:            raise ValueError('padding must be 0')        self.in_channels = in_channels        self.out_channels = out_channels        self.kernel_size = kernel_size        self.stride = to_2tuple(stride)        self.padding = to_2tuple(padding)        self.dilation = to_2tuple(dilation)        self.groups = groups        self.deformable_groups = self.in_channels        self.weight = self.create_parameter(            shape=[out_channels, in_channels // groups, 1, 1])  # kernel size == 1        if bias:            self.bias = self.create_parameter(shape=[out_channels])        else:            self.bias = None        self.register_buffer('offset', self.gen_offset())    def gen_offset(self):        """        offset (Tensor[batch_size, 2 * offset_groups * kernel_height * kernel_width,            out_height, out_width]): offsets to be applied for each position in the            convolution kernel.        """        offset = paddle.empty([1, self.in_channels * 2, 1, 1])        start_idx = (self.kernel_size[0] * self.kernel_size[1]) // 2        assert self.kernel_size[0] == 1 or self.kernel_size[1] == 1, self.kernel_size        for i in range(self.in_channels):            if self.kernel_size[0] == 1:                offset[0, 2 * i + 0, 0, 0] = 0                offset[0, 2 * i + 1, 0, 0] = (i + start_idx) % self.kernel_size[1] - (self.kernel_size[1] // 2)            else:                offset[0, 2 * i + 0, 0, 0] = (i + start_idx) % self.kernel_size[0] - (self.kernel_size[0] // 2)                offset[0, 2 * i + 1, 0, 0] = 0        return offset    def forward(self, input):        """        Args:            input (Tensor[batch_size, in_channels, in_height, in_width]): input tensor        """        B, C, H, W = input.shape        return deform_conv2d(input, self.offset.expand([B, -1, H, W]), self.weight, bias=self.bias, stride=self.stride,                             padding=self.padding, dilation=self.dilation, deformable_groups=self.deformable_groups)

构建CycleMLP模块

class CycleMLP(nn.Layer):    def __init__(self,                 dim,                 qkv_bias=False,                 qk_scale=None,                 attn_drop=0.,                 proj_drop=0.):        super().__init__()        self.mlp_c = nn.Linear(dim, dim, bias_attr=qkv_bias)        self.sfc_h = CycleFC(dim, dim, (1, 3), 1, 0)        self.sfc_w = CycleFC(dim, dim, (3, 1), 1, 0)        self.reweight = Mlp(dim, dim // 4, dim * 3)        self.proj = nn.Linear(dim, dim)        self.proj_drop = nn.Dropout(proj_drop)    def forward(self, x):        B, H, W, C = x.shape        h = self.sfc_h(x.transpose([0, 3, 1, 2])).transpose([0, 2, 3, 1])        w = self.sfc_w(x.transpose([0, 3, 1, 2])).transpose([0, 2, 3, 1])        c = self.mlp_c(x)        a = (h + w + c).transpose([0, 3, 1, 2]).flatten(2).mean(2)        a = self.reweight(a).reshape([B, C, 3]).transpose([2, 0, 1])        a = F.softmax(a, axis=0).unsqueeze(2).unsqueeze(2)        x = h * a[0] + w * a[1] + c * a[2]        x = self.proj(x)        x = self.proj_drop(x)        return x

5.2 确定训练超参

参考论文及official code,主要超参如下:

total batxh size learning rate epochs

10241e-3300

5. 开始使用

5.1 模型预测

基于PaddlePaddle复现的CycleMLP - 创想鸟

In [ ]

%cd /home/aistudio/CycleMLP-paddle%run infer.py     --model=CycleMLP_B1     --infer_imgs=/home/aistudio/CycleMLP-paddle/demo/ILSVRC2012_val_00020010.JPEG     --resume=/home/aistudio/CycleMLP_B1.pdparams

最终输出结果为

[{'class_ids': [178, 211, 209, 210, 246], 'scores': [0.9213957190513611, 0.006610415875911713, 0.0018257270567119122, 0.0013606979046016932, 0.001132593140937388], 'file_name': '/home/aistudio/CycleMLP-paddle/demo/ILSVRC2012_val_00020010.JPEG', 'label_names': ['Weimaraner', 'vizsla, Hungarian pointer', 'Chesapeake Bay retriever', 'German short-haired pointer', 'Great Dane']}]

表示预测的类别为Weimaraner(魏玛猎狗),ID是178,置信度为0.9213957190513611。

5.2 模型训练

单机多卡训练

export CUDA_VISIBLE_DEVICES=0,1,2,3python -m paddle.distributed.launch --gpus="0,1,2,3"     main.py     --model=CycleMLP_B1     --batch_size=256     --data_path=/path/to/imagenet/     --output_dir=./output/     --dist_eval

部分训练日志如下所示。

基于PaddlePaddle复现的CycleMLP - 创想鸟

[16:56:29.233819] Epoch: [261]  [ 920/1251]  eta: 0:05:50  lr: 0.000052  loss: 3.4592 (3.3812)  time: 1.0303  data: 0.0012[16:56:49.578909] Epoch: [261]  [ 940/1251]  eta: 0:05:29  lr: 0.000052  loss: 3.7399 (3.3853)  time: 1.0171  data: 0.0015

5.3 模型评估

export CUDA_VISIBLE_DEVICES=0,1,2,3python -m paddle.distributed.launch --gpus="0,1,2,3"     eval.py     --model=CycleMLP_B1     --batch_size=256     --data_path=/path/to/imagenet/     --dist_eval     --resume=$TRAINED_MODEL

5.4 模型导出

python export_model.py     --model=CycleMLP_B1     --output_dir=./output/     --resume=$TRAINED_MODEL

6. 代码结构

├── cycle_mlp.py├── demo├── engine.py├── eval.py├── export_model.py├── infer.py├── main.py├── README.md├── requirements.txt├── test_tipc└── util

7. 自动化测试脚本

详细日志在test_tipc/output

TIPC: test_tipc/README.md

首先安装auto_log,需要进行安装,安装方式如下: auto_log的详细介绍参考https://github.com/LDOUBLEV/AutoLog。

git clone https://github.com/LDOUBLEV/AutoLogcd AutoLog/pip3 install -r requirements.txtpython3 setup.py bdist_wheelpip3 install ./dist/auto_log-1.2.0-py3-none-any.whl

进行TIPC:

bash test_tipc/prepare.sh test_tipc/config/CycleMLP/CycleMLP_B1.txt 'lite_train_lite_infer'bash test_tipc/test_train_inference_python.sh test_tipc/config/CycleMLP/CycleMLP_B1.txt 'lite_train_lite_infer'

TIPC结果:

如果运行成功,在终端中会显示下面的内容,具体的日志也会输出到test_tipc/output/文件夹中的文件中。

Run successfully with command - python3.7 eval.py --model=CycleMLP_B1 --data_path=./dataset/ILSVRC2012/ --cls_label_path=./dataset/ILSVRC2012/val_list.txt --resume=./test_tipc/output/norm_train_gpus_0_autocast_null/CycleMLP_B1/checkpoint-latest.pd !Run successfully with command - python3.7 export_model.py --model=CycleMLP_B1 --resume=./test_tipc/output/norm_train_gpus_0_autocast_null/CycleMLP_B1/checkpoint-latest.pd --output=./test_tipc/output/norm_train_gpus_0_autocast_null !Run successfully with command - python3.7 inference.py --use_gpu=True --use_tensorrt=False --precision=fp32 --model_file=./test_tipc/output/norm_train_gpus_0_autocast_null/model.pdmodel --batch_size=2 --input_file=./dataset/ILSVRC2012/val  --params_file=./test_tipc/output/norm_train_gpus_0_autocast_null/model.pdiparams > ./test_tipc/output/python_infer_gpu_usetrt_False_precision_fp32_batchsize_2.log 2>&1 !...

更多详细内容,请参考:TIPC测试文档。

以上就是基于PaddlePaddle复现的CycleMLP的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/39316.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月6日 01:49:35
下一篇 2025年11月6日 01:50:01

相关推荐

  • Newt Crash Landing:空投未能推出,价格下降

    纽特(newt)备受期待的空投最终却演变成一场价格崩盘,市场反应远不及预期。是项目规划的问题,还是仅仅是市场波动所致?我们来一探究竟。 Newt坠落:空投未达预期,价格应声下跌 Newt代币在Binance Alpha平台上线之初因空投炒作而引发广泛关注,但结果却令人失望。原本期望借助空投刺激投资者…

    2025年12月8日
    000
  • Newt Crypto的狂野骑行:Binance,Coinbase和Airdrop Aftermath

    纽特加密货币在binance和coinbase上市后经历暴涨,随后因空投接收者套现而大幅回落。这背后有哪些交易逻辑?我们来深入分析。 Newt Crypto的狂野骑行:Binance,Coinbase和Airdrop Aftermath 牛顿协议的原生代币Newt经历了剧烈波动,在登陆Binance…

    2025年12月8日
    000
  • 尖峰上的加密货币:突破潜力和市场采用2025年

    探索2025年最具突破潜力的加密货币,聚焦市场应用、技术创新与社区支持带来的成长动力。 巅峰之上的加密货币:2025年的突破前景与市场采纳 加密行业在2025年持续升温。这次不再是空洞的炒作,而是围绕着具备坚实技术基础、实际应用场景以及活跃社群支撑的项目展开。让我们来看看哪些因素正推动市场采纳,并盘…

    2025年12月8日
    000
  • 数字货币交易软件有哪些?炒比特币最佳选择前五名推荐

    数字货币交易软件,也称为加密货币交易所平台,是用户进行比特币、以太坊以及其他各种数字资产买卖的核心场所。这些平台提供了连接买家与卖家的市场,用户可以在此根据实时价格进行交易操作。选择一个合适可靠的交易软件对于进入数字货币市场至关重要,它直接影响到交易的便捷性、安全性、成本以及可交易资产的多样性。不同…

    2025年12月8日 好文分享
    000
  • 可以炒数字货币的平台有哪些 炒数字货币交易平台排名前十

    数字货币市场的活力日益增强,为全球投资者提供了丰富的交易机会。在这个充满活力的领域,选择一个可靠、安全且功能全面的交易平台至关重要。这些平台是连接用户与数字资产世界的桥梁,其提供的服务水平、安全性以及支持的资产种类直接影响着用户的交易体验和资产安全。本榜单旨在呈现当前市场上表现突出的一些数字货币交易…

    2025年12月8日 好文分享
    000
  • 全球最好用的虚拟币交易所平台

    数字货币市场的活力日益增强,为全球投资者提供了丰富的交易机会。在这个充满活力的领域,选择一个可靠、安全且功能全面的交易平台至关重要。这些平台是连接用户与数字资产世界的桥梁,其提供的服务水平、安全性以及支持的资产种类直接影响着用户的交易体验和资产安全。本榜单旨在呈现当前市场上表现突出的一些数字货币交易…

    2025年12月8日 好文分享
    000
  • 牛顿协议,defi和airdrops:什么是嗡嗡声?

    牛顿协议的defi自动化结合人工智能,再加上空投活动!了解newt在币安上线后价格走势等内容。 牛顿协议、DeFi与空投:背后的亮点是什么? 牛顿协议正引发热议,它将区块链自动化与AI技术融合。全新的上市消息和空投奖励,让Newt成为投资者关注的焦点。以下为你揭晓关键信息。 牛顿协议:由AI赋能的D…

    2025年12月8日
    000
  • NEWT币价格预测:正式登陆现货市场后,价格走势如何?

    目录 牛顿协议(NEWT):赋能可验证链上自动化时代Newton核心功能和技术亮点NEWT代币经济学 NEWT币价格预测  sui生态系统内的项目 newton protocol (newt) 已正式宣布成为币安 hodler 空投计划的一部分,预计将在不久的将来推出。 目前,NEWT 代币已上线多…

    2025年12月8日
    000
  • GateToken(GT)币是什么?GT USDT 实时价格与 2025 年价格预测

    GateToken(GT)币是什么? GT(GateToken)是 GateChain 的链上原生资产,也是 Gate.io 的官方平台币。GT币的价值与 Gate.io 及GateChain 生态的发展息息相关。 截至 2025 年 6 月 24 日,GateToken(GT) 的实时价格为 16…

    2025年12月8日
    000
  • Adam Back认为:比特币(BTC)财库趋势成为加密投机者的新山寨季

    adam back在周一表示,比特币(btc)财库被上市公司采纳,已成为加密货币投机者的新山寨季。 “比特币财库季是投机者的新山寨季(ALT SZN),”Blockstream联合创始人兼首席执行官、Hashcash发明者Adam Back说道。 “是时候将山寨币抛售,转而投资BTC或BTC财库公司…

    2025年12月8日 好文分享
    000
  • 币圈十大交易所app_虚拟币交易所app官网2025

    在数字资产交易中,选择合适的交易平台至关重要,以下是当前市场上一些具有代表性的虚拟币交易平台。1、Binance:全球交易量领先,提供广泛的交易对和产品,拥有高流动性和市场深度,具备强大的安全措施和合规努力,并构建了完整的生态系统。2、OKX:以衍生品交易见长,具备高性能交易引擎,界面兼顾新手与专业…

    2025年12月8日 好文分享
    000
  • 公认的三大交易所币圈 三大交易所分别是指

    加密货币交易所是数字资产交易的核心平台,主要交易所包括:1.Binance,全球交易量最大的交易所之一,提供多样化的交易产品和服务,并构建了庞大的生态系统;2.OKX,亚洲知名交易平台,在合约交易和现货交易领域具备深厚技术实力,提供创新工具;3.gate.io以支持众多币种著称,提供多样化交易方式并…

    2025年12月8日 好文分享
    000
  • 一文详解欧盟、阿联酋、新加坡三地稳定币监管框架

    本文对稳定币的监管框架的分析主要将从以下几个角度展开:监管进程、规范文件、监管部门以及监管框架的核心内容,具体内容框架如下: 目录 (一)欧盟 1、监管进程和规范文件 2、对应监管部门 3、监管框架主要内容 a.稳定币的定义 b.发行人的准入门槛 c.币值稳定机制和储备资产的维持 d.流通环节的合规…

    2025年12月8日 好文分享
    000
  • 什么是抄底止盈策略?如何使用?欧易抄底止盈策略使用教学(最新版)

    抄底止盈策略是基于双币理财产品自动进行抄底、止盈赚取票息和币价上涨收益的策略循环套利,并利用基于双币理财的低买和高卖两个方向进行循环投入套利。以下是设置抄底止盈策略的详细步骤 欧易官方注册地址:https://www.okx.com/ OKX APP下载地址:https://download.fpn…

    2025年12月8日 好文分享
    000
  • 灰度上线的Space and Time Trust(SXT)信托是什么?有什么用?

    如果说2024年是比特币现货etf获批、正式开启机构元年的话,那么当时间进入2025年,市场的旋律正悄然转向更为深邃的底层乐章。当大众的目光逐渐从比特币价格的每一次跳动中移开,行业中最敏锐的捕食者——灰度(grayscale),已将它的触角伸向了一个定义未来的新领域。 近日,灰度正式推出了其“Spa…

    2025年12月8日
    000
  • TRON(TRX)是什么?TRX代币经济学、未来价格介绍

    虽然区块链的头条新闻通常关注比特币的价格走势或以太坊的最新升级,但有一个网络已悄然将自己定位为全球数字支付的支柱,为数十亿美元的日常交易提供支持。 本文探讨了 TRON 从内容共享愿景发展成为全球最大的稳定币网络的过程,同时根据最近的发展评估了其独特的技术、不断发展的生态系统和 TRX 的投资前景。…

    2025年12月8日
    000
  • 币圈专业交易平台排行榜2025

    进入数字资产交易领域,选择一个可靠、功能全面且安全的专业交易平台是每位投资者必须面对的核心议题。市场的喧嚣与技术的快速迭代,使得交易平台的综合实力成为衡量其价值的关键标尺。一个卓越的平台不仅仅是提供买卖服务的场所,它更是一个集成了深度流动性、丰富交易产品、尖端技术架构与完善用户服务的综合性金融生态。…

    2025年12月8日 好文分享
    000
  • 币圈公认的十大交易所交易所排名(2025版)

    加密货币交易平台是用户参与数字资产市场的重要入口,选择平台时需综合考虑交易费用、币种数量、用户体验、安全性和合规性等因素。1. Binance以高交易量和广泛的交易对著称,提供多样金融产品及全方位服务;2. OKX在衍生品交易领域突出,支持多种出入金方式并构建一站式服务平台;3. gate.io以丰…

    2025年12月8日 好文分享
    000
  • 如何快速联系欧易官客服?怎么转OKX人工客服?(2025最新/手机和web)

    okx欧易怎么转人工客服?怎么联系okx欧易官方客服呢?okx欧易电话客服在哪? OKX客服支援涵盖多个领域,包括帐号管理、交易问题、资金安全以及平台功能的使用说明,使用者可以透过多种方式联系客服,包括即时聊天、电子邮件和官方社交媒体平台,让使用者快速找到解决方案。 下面,本站小编给大家详细介绍下O…

    2025年12月8日 好文分享
    000
  • 一文详解SPK代币价格及2025年价格预测

    目录 SPK 的首秀代币暴跌背后:空投套利与流动性危机技术优势:Spark Protocol 的三大核心支柱2025 年价格预测:机构观点分歧明显未来挑战:如何在DeFi 红海中突围投资建议:高风险与潜在回报并存未来展望 2025 年6 月17 日,由原makerdao 核心团队打造的spark p…

    2025年12月8日
    000

发表回复

登录后才能评论
关注微信