fig
-
基于 PaddleVideo 的TokShift-Transformer复现
本文介绍飞桨论文复现挑战赛第六期Token Shift Transformer视频分类冠军复现代码,已入Paddle Video套件。该代码复现的模型结合ViT与TSM,在UCF101数据集上,以特定条件达成92.81%的Top1准确率,超目标值,并说明了相关操作步骤与结构。 ☞☞☞AI 智能聊天,…
-
基于PaddleOCR的渔船牌照识别
本文采用PaddleOCR开源项目实现渔船牌照识别。因开源数据集少,自行按规则生成1000张渔牌数据,按8:2划分训练集与测试集。经环境安装、预训练模型获取、数据集处理、模型训练等步骤,最终实现识别,虽因训练时长可能效果欠佳,但完成了基本流程。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …
-
在自定义数据集上实现OpenAI CLIP
在2021年1月,openai宣布了两个新模型:dall-e和clip。这两个模型都是多模态模型,以某种方式连接文本和图像。clip的全称是对比语言-图像预训练(contrastive language-image pre-training),它是一种基于对比文本-图像对的预训练方法。为什么要介绍c…
-
基于全色影像引导数据分布变化的高光谱全色融合网络-Pgnet
本文提出基于PaddlePaddle的Pgnet网络,用于大比例(ratio=16)高光谱与全色影像融合。该网络从纠正数据分布角度,设计PDIN子网络,结合多层上采样和像素级注意力机制。通过编码器-融合-解码器框架在丰度空间处理,经多数据集实验验证,在光谱和空间保真度上表现优异,证实了数据分布变换注…
-
当程序员刷多了井川里予之后
本文讲述将“抖音纯欲天花板”小姐姐舞蹈视频转为字符跳舞视频的实现。过程分五步:将原视频转字符图片,合成新视频,提取背景音乐,添加音乐到新视频,清除过程文件(若配置不保留)。并给出了实现该功能的Python代码,涉及多种库的使用。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 …
-
图像分割预处理简单实用技巧
本文记录图像分割预处理知识,面向新手。先说明目标检测、分类与分割的labels差异,解释分割mask因0、1取值显纯黑,可转为0、255显示。接着介绍mask“显形”“勾勒形状”“图像融合”“简单上色”及“还原色彩”的方法,附具体代码,还拓展了三通道分离知识,助新手理解。 ☞☞☞AI 智能聊天, 问…
-
柠檬分类竞赛:飞桨图像分类套件PaddleClas竞赛实战
本文介绍飞桨图像分类套件PaddleClas竞赛实战方法,包括模型库概览,其提供服务器端和端侧模型;还讲解了竞赛实战的前置条件、数据集准备、模型训练评估、数据增广、图像推理等,最后提及番外篇用PaddleX做图像分类。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepS…
-
『NLP打卡营学习笔记』实践课2:文本语义相似度计算
本文介绍基于ERNIE-Gram模型实现语义匹配的案例。以LCQMC数据集为例,说明文本语义匹配任务,即判断两段文本语义是否相似。还讲解了数据加载、预处理、模型搭建、训练、评估和预测的过程,以及PaddleNLP的相关数据集和数据API的使用。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, …
-
针对目标检测的对抗攻击
本项目测试YOLOv3模型鲁棒性,利用PaddleDetection库,在COCO2017数据集上训练模型,其对dog.jpg检测精确率达98%。通过添加椒盐噪声生成对抗样本dog2.png,再次检测时,正确率大幅下降,部分目标甚至消失,以此展示对抗样本对模型检测能力的攻击效果。 ☞☞☞AI 智能聊…
-
Positional Encoding高频位置编码
本文围绕位置编码(Positional Encoding)在神经网络拟合图片中的作用展开实验。通过PaddlePaddle构建NeRF2D神经网络,分别在不使用和使用位置编码的情况下,以坐标预测像素RGB值。对比发现,加入含三角函数的位置编码后,拟合结果更清晰,验证了其提升神经网络表示能力的效果。 …