latte

  • 超越BEVFusion!DifFUSER:扩散模型杀入自动驾驶多任务(BEV分割+检测双SOTA)

    写在前面&笔者的个人理解 目前,随着自动驾驶技术的越发成熟以及自动驾驶感知任务需求的日益增多,工业界和学术界非常希望一个理想的感知算法模型,可以同时完成三维目标检测以及基于BEV空间的语义分割任务。对于一辆能够实现自动驾驶功能的车辆而言,其通常会配备环视相机传感器、激光雷达传感器以及毫米波雷…

    2025年11月7日 科技
    000
  • 爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP

    多层感知器(MLP),也被称为全连接前馈神经网络,是如今深度学习模型的基础构建块。MLP 的重要性无论如何强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。 但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 ——KAN。该方法在准确性和可解释性方面表现优于 MLP。…

    2025年11月7日 科技
    000
  • 【AI达人特训营第三期】Conv2Former:一种ViT风格的卷积模块

    本文复现了Conv2Former模型,其采用Transformer风格的QKV结构,以卷积生成权重加权,平衡全局信息提取与计算开销。在CIFAR-10数据集上,用Conv2Former-N参数({64,128,256,512}维度,{2,2,8,2}深度)训练50个epoch,验证集准确率达82%,…

    2025年11月6日 科技
    100
  • 轻量级人像分割模型:SINet 和 ExtremeC3Net

    本文介绍SINet和ExtremeC3Net两个轻量级人像分割模型,二者参数分别为0.087M、0.038M,Flop为0.064G、0.128G。可通过PaddleHub快速调用,也能基于PaddleInference推理部署,并给出了Paddle2.0上的实现代码。 ☞☞☞AI 智能聊天, 问答…

    2025年11月6日
    000
  • 【PaddlePaddle】基础理论教程 – 卷积神经网络概论

    本文围绕二维卷积及卷积神经网络展开,先讲解二维卷积运算的概念、原理及Paddle框架实现,介绍卷积算子的定义、参数。还阐述卷积神经网络的卷积层、汇聚层算子,最后以LeNet为例,说明其在手写体数字识别任务中的数据集构建、模型构建、训练、评价与预测过程。 ☞☞☞AI 智能聊天, 问答助手, AI 智能…

    2025年11月6日
    400
  • EfficientFormer: 速度上可以与MobileNet媲美的ViT

    EfficientFormer是纯Transformer模型,经优化设计,在移动设备上表现优异。最快的L1在ImageNet-1K准确率79.2%,iPhone 12延迟1.6毫秒,与MobileNetv2×1.4速度相当,证明合理设计的Transformer能兼顾低延迟与高性能。 ☞☞☞AI 智能…

    2025年11月6日 科技
    000
  • 【赛博魔杖】PaddlePaddle3.0助力36类魔法手势识别

    基于PaddlePaddle3.0搭建神经网络,来实现36类时间段动作的识别,目前测试集准确度约为91.25%,识别输入的手势,可遥控开灯开空调以及开原神 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 项目起源 项目起源于同学在进行魔法棒控…

    2025年11月6日 科技
    000
  • 【TMM 2022】SPGNet:串行和并行组网络

    SPGNet是一种基于串行和并行组块的新型卷积神经网络。其深入研究分组卷积,分为串行、并行和串并行三种类型,能捕获多尺度信息且结构紧凑。在图像分类等任务中表现优异,与最先进网络性能相当,在NPU上,类似FLOPs下比MobileNetV2快120%,类似精度下比GhostNetkuai300%以上。…

    2025年11月6日 科技
    000
  • 《动手学深度学习》Paddle 版源码-5.08章(NIN)

    网络中的网络(NiN)不同于LeNet、AlexNet和VGG,它串联多个含卷积层和1×1卷积层(替代全连接层)的NiN块构建深层网络。其用输出通道数等于标签类别数的NiN块加全局平均池化层替代全连接输出层,可减小参数、缓解过拟合,训练类似AlexNet但学习率更大,思想影响后续卷积神经网络设计。 …

    2025年11月6日
    000
  • 屠榜CV!Swin TransFromer 你又该换Backbone了!

    本文介绍Swin Transformer相关知识,对比其与ViT的区别:Swin采用窗口理念和不同下采样倍数,减少计算量且提升性能。还讲解了其Patch层、PatchMerging层、Mlp层及Swin Transformer Block层的实现,包括各层作用、代码和参数等。 ☞☞☞AI 智能聊天,…

    2025年11月6日 科技
    100
关注微信