基于PaddleDetection的智能零售柜商品识别+部署

智能零售结算系统,其目的旨在于利用计算机视觉领域中国的图像识别及目标检测技术,精准地对顾客购买的商品进行智能化、自动化的价格结算。当顾客将自己选购的商品放置在制定区域的时候,一个理想的智能零售结算系统应当能够精准地识别每一个商品,并且能够返回完整地购物清单及顾客应付的实际商品总价格。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

基于paddledetection的智能零售柜商品识别+部署 - 创想鸟

基于PaddleDetection的智能零售柜商品识别

一、赛题背景

智能零售结算系统,其目的旨在于利用计算机视觉领域中国的图像识别及目标检测技术,精准地对顾客购买的商品进行智能化、自动化的价格结算。当顾客将自己选购的商品放置在制定区域的时候,一个理想的智能零售结算系统应当能够精准地识别每一个商品,并且能够返回完整地购物清单及顾客应付的实际商品总价格。

二、赛题任务

通过PaddleDetection实现智能零售结算系统,其目的旨在于利用计算机视觉领域中国的图像识别及目标检测技术,精准地对顾客购买的商品进行智能化、自动化的价格结算。

基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟        

三、数据集介绍

本数据集采用VOC格式,符合大多深度学习开发套件对数据集格式的要求,可满足paddlex或PaddleDetection的训练要求。本数据集总数据量为5422张,且所有图片均已标注,共有113类商品。本数据集以对数据集进行划分,其中训练集3796张、验证集1084张、测试集542张。!基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟        

四、提交实例

参赛者需要将所有模型检测结果放入一个csv文件中,命名为submission.csv,文件内容格式如下表所示: 每一行为一个待检测图像的信息和结果,其中第一列存储待检测的图像名称(不包含后缀名),第二列存储检测的垂直边框信息,具体边框信息格式为[目标矩形中心点相对横坐标 目标矩形中心点相对纵坐标 目标矩形相对长度比例 目标矩形相对宽度比例](数字间用英文空格隔开),如果有多个垂直边框,用英文的“;”将边框信息进行分离。基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟        

五、数据预处理

竞赛训练数据集中包括两类数据文件,第一类是.jpg格式的图像文件,第二类是xml格式的商品标注信息xml文件,两者通过相同的名称进行关联,名称命名规则可忽略。

下载数据集(训练集和测试集) 数据集已制作上传,可以直接引用。

其次解压数据集 执行以下命令解压数据集,解压之后将压缩包删除,保证项目空间小于100G。否则项目会被终止。

In [ ]

# 1.安装依赖%cd work/!git clone https://gitee.com/PaddlePaddle/PaddleDetection.git -b develop%cd PaddleDetection/

   In [ ]

%cd PaddleDetection/!pip install -r requirements.txt# !pip install paddlex

   In [4]

# 2.解压数据集!unzip -oq /home/aistudio/data/data91732/VOC.zip -d /home/aistudio/PaddleDetection/dataset/shoping

   

六、模型训练

1.利用PaddleDetection套件中的faster_rcnn_swin_tiny_fpn_1x_coco模型完成货柜中商品识别任务的训练,首先在https://gitee.com/PaddlePaddle/PaddleDetection.git 里,进行克隆,下载项目。基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟        

2.模型介绍: Faster RCNN其实可以分为4个主要内容:

(1)Conv layers。作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。

(2)Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative,再利用bounding box regression修正anchors获得精确的proposals。

(3)Roi Pooling。该层收集输入的feature maps和proposals,综合这些信息后提取proposal feature maps,送入后续全连接层判定目标类别。

(4)Classification。利用proposal feature maps计算proposal的类别,同时再次bounding box regression获得检测框最终的精确位置。基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟 上图展示了模型中的faster_rcnn(backbone为vgg16)的网络结构,可以清晰的看到该网络对于一副任意大小PxQ的图像:

首先缩放至固定大小MxN,然后将MxN图像送入网络;而Conv layers中包含了13个conv层+13个relu层+4个pooling层;RPN网络首先经过3×3卷积,再分别生成positive anchors和对应bounding box regression偏移量,然后计算出proposals;而Roi Pooling层则利用proposals从feature maps中提取proposal feature送入后续全连接和softmax网络作classification(即分类proposal到底是什么object)。

在本文中所选用的模型是PaddleDetection套件中的faster_rcnn_swin_tiny_fpn_3x_coco模型,backbone选用了Swin_Transformer,其余结构均与上述相同。引入Swin_transformer的优点主要有:将层次性、局部性和平移不变性等先验引入Transformer网络结构设计。

爱图表 爱图表

AI驱动的智能化图表创作平台

爱图表 305 查看详情 爱图表

核心创新:移位窗口(shifted window)设计:
1)自注意的计算在局部的非重叠窗口内进行。这一设计有两方面的好处,一是复杂度从此前的和图像大小的平方关系变成了线性关系,也使得层次化的整体结构设计、局部先验的引入成为可能,二是因为采用非重叠窗口,自注意计算时不同query会共享同样的key集合,从而对硬件友好,更实用。
2)在前后两层的Transformer模块中,非重叠窗口的配置相比前一层做了半个窗口的移位,这样使得上一层中不同窗口的信息进行了交换。 相比于卷积网络以及先驱的自注意骨干网络(Local Relation Net和SASA)中常见的滑动窗(Sliding window)设计,这一新的设计牺牲了部分平移不变性,但是实验发现平移不变性的部分丢失不会降低准确率,甚至以为正则效应效果更好。同时,这一设计对硬件更友好,从而更实用而有希望成为主流。基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟本文中所选用模型所使用的backbone参数解释:

SwinTransformer:  embed_dim: 96  depths: [2, 2, 6, 2]  num_heads: [3, 6, 12, 24]  window_size: 7    ape: false  drop_path_rate: 0.1  patch_norm: true  out_indices: [0,1,2,3]  pretrained: https://paddledet.bj.bcebos.com/models/pretrained/swin_tiny_patch4_window7_224.pdparams

       patch_size=4对应的是之前在网络结构中Patch Partition之后下采样多少倍;embed_dim=96对应原网络结构中通过Linear Embedding之后得到的C;depths=(2, 2, 6, 2)对应每一个stage中重复Swin Transformer Block的次数;num_heads=(3, 6, 12, 24)对应的是每一个Swin Transformer Block当中所采用的Multi head的head个数;window_sizw=7对应的是W-MSA或SW-MSA中采用window的大小;mlp_ratio=4是在MLP模块中第一个全连接层将我们的channel翻多少倍;qkv_bias=True代表说在multi-self attention中是否使用偏置;第一个drop_rate是接在我们PatchEmbed后面的;第二个attn_drop_rate对应的是在attention中采用的droprate;第三个drop_path_rate对应的是在每一个swin transformer中采用的droprate。

3.利用PaddleDetection套件中的目标检测模型完成货柜中商品识别任务,修改参数以及数据集路径,这里选用配置文件中的configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_1x_coco.yml对数据进行训练。
(1)修改work/PaddleDetection/configs/datasets/voc.yml中的voc数据集所在路径和num_classes。

metric: VOCmap_type: 11pointnum_classes: 113TrainDataset:  !VOCDataSet    dataset_dir: dataset/shoping    anno_path: train_list.txt    label_list: labels.txt    data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']EvalDataset:  !VOCDataSet    dataset_dir: dataset/shoping    anno_path: test_list.txt    label_list: labels.txt    data_fields: ['image', 'gt_bbox', 'gt_class', 'difficult']TestDataset:  !ImageFolder    anno_path: dataset/voc/labels.txt

       

(2)修改work/PaddleDetection/configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_1x_coco.yml中数据集格式

_BASE_: [  '../datasets/voc.yml',  '../runtime.yml',  '_base_/optimizer_swin_1x.yml',  '_base_/faster_rcnn_swin_tiny_fpn.yml',  '_base_/faster_rcnn_swin_reader.yml',]weights: output/faster_rcnn_swin_tiny_fpn_1x_coco/model_final

   In [ ]

# 4.选用PaddleDetection中的目标检测模型,修改参数以及数据集路径,这里选用faster_rcnn_swin_tiny_fpn_1x_coco.yml对数据进行训练。%cd ~/PaddleDetection!python  ./tools/train.py -c ./configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_1x_coco.yml --use_vdl True --vdl_log_dir ./log --eval

   

七、模型预测

将预测txt和jpg保存到/home/aistudio/test_a/

In [ ]

# 5.模型预测!python tools/infer.py -c ./configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_1x_coco.yml --infer_dir=/home/aistudio/work/PaddleDetection/dataset/shoping/JPEGImages/ --save_txt=True --output_dir=/home/aistudio/work/PaddleDetection/output_img/

   

八、模型【评估】

使用训练好的模型在验证集上进行评估,具体代码如下:

In [ ]

# 评估!export CUDA_VISIBLE_DEVICES=0'''    -c:指定模型配置文件    -o weights:加载训练好的模型'''!python tools/eval.py -c configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_1x_coco.yml               -o weights=output/faster_rcnn_swin_tiny_fpn_1x_coco/best_model.pdparams

   

九、模型调优

预训练模型:使用预训练模型可以有效提升模型精度,faster_rcnn_swin_tiny_fpn_1x_coco.yml模型提供了在COCO数据集上的预训练模型修改loss:将目标检测中的GIOU loss改为DIOU loss修改lr:调整学习率,这里将学习率调小一半修改lr再训练:当模型不再提升,可以加载训练好的模型,把学习率调整为十分之一,再训练。

十、模型导出

在模型训练过程中保存的模型文件是包含前向预测和反向传播的过程,在实际的工业部署则不需要反向传播,因此需要将模型进行导成部署需要的模型格式。 执行下面命令,即可导出模型。

In [ ]

!export CUDA_VISIBLE_DEVICES=0!python tools/export_model.py       -c configs/faster_rcnn/faster_rcnn_swin_tiny_fpn_1x_coco.yml       -o weights=output/faster_rcnn_swin_tiny_fpn_1x_coco/best_model.pdparams       --output_dir=inference_model

   

十一、模型推理

在终端输入以下命令进行预测,详细教程请参考Python端预测部署:

In [ ]

!export CUDA_VISIBLE_DEVICES=0'''    --model_dir: 上述导出的模型路径    --image_file:需要测试的图片    --image_dir:也可以指定要测试的文件夹路径    --device:运行时的设备,可选择CPU/GPU/XPU,默认为CPU    --output_dir:可视化结果保存的根目录,默认为output/'''!python deploy/python/infer.py         --model_dir=./inference_model/faster_rcnn_swin_tiny_fpn_1x_coco         --image_file=/home/aistudio/PaddleDetection/dataset/shoping/JPEGImages/ori_XYGOC2021042116153323901IK-3_0.jpg         --device=GPU

   

预测模型会导出到inference_model/目录下,包括model.pdmodel、model.pdiparams、model.pdiparams.info和infer_cfg.yml四个文件,分别表示模型的网络结构、模型权重、模型权重名称和模型的配置文件(包括数据预处理参数等)的流程配置文件。

使用用全量数据集上训练的模型,在包含542张图片的验证集上评估,效果如下,mAP(0.5)=99.29%:

十二、数据可视化基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟        

基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟 训练20轮检测效果如下图所示:基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟基于PaddleDetection的智能零售柜商品识别+部署 - 创想鸟        

以上就是基于PaddleDetection的智能零售柜商品识别+部署的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/744348.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月25日 16:50:26
下一篇 2025年11月25日 16:51:32

相关推荐

  • Polygon的POL代币在Heimdall v2升级前飙升:纽约时刻解读发生了什么

    随着 heimdall v2 升级日益临近,pol 币价上涨动能增强。以下是此次升级的重要进展、技术层面的分析以及对 polygon 生态的影响解读。 在 2025 年 7 月 10 日即将迎来 Heimdall v2 主网升级之际,Polygon 的 POL 代币近期表现得尤为活跃。这次针对 Po…

    2025年12月8日
    000
  • USDC、DAI、TUSD区别与优缺点对比(最近更新)

    稳定币作为连接数字世界与传统金融的桥梁,在加密生态中扮演着至关重要的角色。然而,并非所有稳定币都生而平等,像usdc、dai和tusd这些主流稳定币,其背后的发行机制、抵押资产和风险特征存在显著差异。理解这些核心区别,有助于用户根据自身对安全性、去中心化和透明度的不同需求,做出更明智的选择。 全球主…

    2025年12月8日
    000
  • 加密货币最牛的交易所有哪些2025

    加密货币交易所在数字资产领域扮演着至关重要的角色,它们是连接传统金融与新兴加密经济体的桥梁。众多平台在全球范围内提供数字资产的买卖、交易及存储服务。不同的交易所有着各自的特点、优势和用户群体,选择一个合适的平台对于参与加密货币市场至关重要。以下列出了一些在业界具有较高知名度和影响力的交易所,它们在交…

    2025年12月8日 好文分享
    000
  • Jupiter Studio打新平台上线,创建代币功能介绍

    7月4日,solana 生态的重要协议 jupiter 正式上线了其 launchpad 平台 jupiter studio,这不仅对“pump.fun 式发币模式”进行了优化升级,更像是 jupiter 凭借自身流动性和平台入口优势,亲手打造的一场“链上创业工厂”。 接下来,我们一起来体验 Jup…

    2025年12月8日
    000
  • 哪些币在逆势上涨 山寨币最近行情走势

    当前市场震荡中,部分山寨币凭借独特优势逆势上涨。1. TON受益于与Telegram的整合及生态应用爆发增长;2. AI相关代币如FET、RNDR因科技叙事和行业突破获得关注;3. Memecoin如PEPE、WIF依赖社区共识和文化传播形成情绪牛市;4. RWA赛道代币如ONDO通过链接现实资产吸…

    2025年12月8日
    000
  • 充值BTC出现延迟?该如何处理?详细指南

    BTC充值长时间未到账时,应按以下步骤处理:1. 获取交易ID(TxID),这是查询交易状态的关键信息;2. 使用区块浏览器(如Mempool.space、Blockchain.com)输入TxID查看确认数;3. 根据确认状态判断情况并采取措施:若未确认,可能是网络拥堵或手续费过低,可耐心等待或联…

    2025年12月8日
    000
  • 比特币和山寨币有什么区别:五大维度全解析!

    目录 1.比特币/山寨币的定义与分类2.技术架构与共识机制3.功能定位与应用生态4.市场结构与价格特征5.监管状态与合规差异6.生命周期与开发活跃度7.比特币 VS 山寨币, 如何选择? 区块链技术的兴起始于 2009 年比特币的问世。此后,大量基于区块链的创新项目涌现,逐渐形成了以比特币为核心资产…

    2025年12月8日
    000
  • Dog go to the moon 是什么?比特币上的头号 Meme 币

    在加密货币领域,“dog to the moon” 并不只是一个标语,它象征着社区对代币价值飙升的强烈信念。而 $dog(dog•go•to•the•moon)正是这一理念的最佳体现——作为比特币链上首个现象级 meme 币,它通过去中心化空投和零预售的方式,重新定义了加密资产分配的公平性。 $DO…

    2025年12月8日
    000
  • Javsphere 是什么? JAV 代币2025年价格预测、市场前景分析

    Javsphere 是什么? JAV 代币2025年价格预测、市场前景分析 Javsphere 是一个新兴的 Web3 去中心化计算网络,旨在通过分布式节点提供高性能的 AI 代理服务与链上数据处理能力。其核心创新在于结合了模块化区块链架构与意图驱动(Intent-Centric)的执行引擎,允许用…

    2025年12月8日
    000
  • 山寨币还有希望吗?2025下半年能回本吗?

    2025年下半年山寨币能否回本取决于资产质量和市场环境。1)比特币必须保持强势,引领资金流入加密市场;2)宏观经济需改善,如美联储降息带来流动性;3)行业进展如ETF获批将注入增量资金。优质山寨币分为四个梯队:第一梯队为蓝筹币如ETH、SOL、BNB,生态稳固技术持续升级,最有可能创新高;第二梯队为…

    2025年12月8日
    000
  • 2025年最有潜力的山寨币排行榜Top 10

    2025年最具潜力的山寨币包括Solana、Chainlink、Arbitrum等共10种。1. Solana凭借高速低费和PoH机制,有望实现大规模商业应用;2. Chainlink作为去中心化预言机领导者,通过CCIP成为跨链关键基础设施;3. Arbitrum作为以太坊Layer 2,具备活跃…

    2025年12月8日
    000
  • 普通人如何提前埋伏到即将暴涨的山寨币

    1.追踪聪明资金动向,关注巨鲸账户对低市值新项目的持续小额买入;2.分析链上数据,通过持有人数、活跃地址数及交易量等指标判断项目真实基本面;3.捕捉热门叙事趋势,结合行业领袖观点与社区热度提前布局新兴概念;4.深度研究项目基本面,评估价值主张、团队背景、代币模型及投资机构背书。通过综合运用Arkha…

    2025年12月8日
    000
  • AI、RWA、GameFi赛道,哪个更有前景?龙头币种分析

    当前加密市场聚焦AI、RWA和GameFi三大赛道。1. AI赛道结合人工智能与区块链,解决中心化AI问题,代表项目包括TAO、RNDR和FET;2. RWA赛道通过代币化连接传统金融与加密世界,核心项目有ONDO、MKR和POLYX;3. GameFi赛道融合游戏与金融,推动大众应用,重点项目为I…

    2025年12月8日
    000
  • RCADE币是什么?值得投资吗?RCADE项目概述与代币经济介绍

    目录 RCADE:简要事实RCADE 是什么?RCADE代币空投计划有多少个 RCADE 代币?RCADE节点RCADE链RCADE 的功能是什么?RCADE 与比特币:目的比较RCADE背后的技术团队与起源RCADE:优势、挑战和前景潜在优势潜在风险和挑战结论 web3 游戏( gamefi )的…

    2025年12月8日 好文分享
    000
  • 币圈入门:什么是阻力位?3个方法教你快速找到它

    阻力位是价格难以突破的“天花板”,可通过三种方法识别:1.连接前期历史高点,因卖压集中形成阻力;2.利用移动平均线,如50日均线作为动态阻力;3.绘制下降趋势线,连接连续降低的高点。 在数字资产市场中,理解图表上的关键位置至关重要。其中,“阻力位”是一个核心概念,它能帮助你判断潜在的卖出时机和市场的…

    2025年12月8日
    000
  • 2025年下半年加密货币市场展望:将面临哪些机遇与挑战?

    目录 1.全球宏观环境改善2.机构化浪潮:ETF 流入与企业储备策略交织3.超级周期 or 结构牛?市场分化带来新机遇3. 1 链上活跃度提升但 FOMO 有限3.2 山寨币分化显著,蓝筹效应强化3.3 周期内部再结构:从炒作向实用性过渡4.技术持续驱动,生态纵深发展4.1 RWA(Real-Wor…

    2025年12月8日
    000
  • 波卡是什么跨链协议?创立者是谁?属于主流吗?

    波卡是一个多链框架,由中继链和平行链组成,旨在提升区块链的互操作性和扩展性。1. 中继链负责网络安全和跨链通信;2. 平行链是可定制的独立区块链,共享中继链安全性;3. 平行线程为低成本、灵活接入的链提供按需安全服务。此外,波卡由以太坊联合创始人加文·伍德创立,并得到了Web3基金会和Parity …

    2025年12月8日
    000
  • 10u战神是什么?真的能盈利吗?一文读懂小资金合约交易策略

    “10u战神”是指交易者使用极小额资金(如10u)配合极高杠杆进行高风险合约交易的行为,其本质是以小博大、缺乏风控的赌式操作。1.该行为依赖极限杠杆,市场微幅波动即可能导致爆仓;2.交易成本占比高,压缩盈利空间;3.缺乏策略与风控,完全依赖运气;4.容易扭曲交易心态,影响长期发展。因此,“10u战神…

    2025年12月8日
    000
  • SUI价格对比Solana:市场炒作与加密货币霸权之争

    尽管sui引发了广泛关注,但它在与solana的较量中仍面临不小阻力。solana牢固的市场根基和其在defi领域的统治地位,使其成为难以撼动的强大对手。 加密圈内热议不断,SUI成为众人瞩目的焦点。它是否具备潜力成长为下一个Solana?虽然SUI的价格经历多次波动,但市场的关注度依旧高涨。然而,…

    2025年12月8日
    000
  • 以太坊与阻力位的博弈:区间突破能否点燃山寨季?

    以太坊正处于一个至关重要的转折时刻,潜在的区间突破正在酝酿。它是否能够冲破阻力,点燃山寨币行情?还是再次陷入震荡调整? 如同一位技艺高超的舞者,以太坊正与关键阻力展开一场微妙的“较量”。ETH价格目前维持在 2,500 美元附近,显示出一定支撑力量,但市场仍密切关注:它是否能成功跳出当前震荡格局,带…

    2025年12月8日
    000

发表回复

登录后才能评论
关注微信