udio_第11页_创想鸟

依利浦实验室人工智能平台为Ceva NeuPro-Nano NPU优化，推动实现更智能的边缘设备

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 从领先的半导体厂商到具有前瞻视野的消费电子品牌，各类Ceva客户如今都能在NeuPro-Nano NPU平台上全面应用依利浦实验室的端到端人工智能软件解决方案AI Virtual Smart S…

程序猿

2025年11月25日 • 用户投稿

0000

Kling-Foley— 可灵AI推出的多模态视频生音效模型

kling-foley 是由可灵 ai 开发的一款多模态视频音效生成模型。该模型以视频内容和文本提示作为输入条件，能够生成语义相关、时间同步的高质量立体声音频，包括音效和背景音乐等多种类型的声音内容，并且支持生成任意时长的音频。其核心技术基于多模态控制的流匹配架构，通过融合多模态特征与特定模块处理，…

程序猿

2025年11月25日 • 用户投稿

0000

如何调用Google的Gemini API 使用Gemini进行多模态处理的实战教学

调用google的gemini api进行多模态处理的关键在于熟悉api流程与模型特性。1. 获取google cloud账号并在ai studio中启用gemini api，获取api密钥；2. 安装google-generativeai库并配置密钥；3. 使用generativemodel对象调…

程序猿

2025年11月25日 • 用户投稿

0000

基于PaddleDetection的智能零售柜商品识别+部署

智能零售结算系统，其目的旨在于利用计算机视觉领域中国的图像识别及目标检测技术，精准地对顾客购买的商品进行智能化、自动化的价格结算。当顾客将自己选购的商品放置在制定区域的时候，一个理想的智能零售结算系统应当能够精准地识别每一个商品，并且能够返回完整地购物清单及顾客应付的实际商品总价格。 ☞☞☞AI 智…

程序猿

2025年11月25日 • 用户投稿

0000

百度网盘AI大赛：文档图像阴影消除参赛方案 AB榜第二名

本文开源百度网盘AI大赛文档图像阴影消除参赛方案，基于IDR网络改进：底层加Non-Local模块，提升全局信息获取能力；特征通道增至96，增强学习能力。通过添加随机阴影等数据增强提升多样性，调整损失函数使PSNR达40+。还分享了扩大卷积核等失败尝试，感谢相关支持，附各模型离线验证分数及代码相关说…

程序猿

2025年11月25日 • 用户投稿

2000

百度网盘AI大赛——图像处理挑战赛：手写文字擦除第10名方案

该方案为百度网盘AI大赛手写文字擦除挑战赛第10名方案，基于MTRNet++实现。先介绍文字擦除算法及GAN结构，再说明MTRNet++的改进、结构与损失函数。接着阐述制作流程，包括数据处理、训练、测试等步骤，还给出涨点思路，其在相关数据集上表现优异。 ☞☞☞AI 智能聊天, 问答助手, AI 智能…

程序猿

2025年11月25日 • 用户投稿

1000

PVT v2：超越 Swin 的新型金字塔 ViT

本文复现了PVT v2模型，其基于v1改进，亮点是Linear SRA。代码包含导入包、基础模块定义、模型组网等部分，还提供了不同缩放结构及预训练权重。通过在Cifar10数据集上训练5轮验证性能，模型表现良好。PVT v2引入卷积等操作提升性能，参数量和计算量较小，下游任务表现佳。 ☞☞☞AI 智…

程序猿

2025年11月25日 • 用户投稿

1000

浅析并实现 CycleMLP，一种用于密集预测的类 MLP 模型

CycleMLP是用于视觉识别和密集预测的通用主干，相较MLP Mixer等模型，能处理不同图像大小，以线性计算复杂度实现局部窗口操作。其核心是Cycle FC，结合并行算子与Channel MLP，有5种模型。在ImageNet – 1K和ADE20K上表现优异，参数和计算量更少。 ☞…

程序猿

2025年11月25日 • 用户投稿

0000

豆包 AI 大模型如何和 AI 模型音效添加工具结合添加音效？教程解读

豆包ai大模型与ai音效工具结合的核心在于利用其文本理解与生成能力，为音效创作提供精准、富含上下文的指令或素材。1. 豆包ai充当“剧本医生”和“创意总监”，基于场景描述自动生成细致入微的音效提示；2. 将这些文本输入ai音效工具，由其合成或匹配相应音频；3. 最后通过人工筛选、调整和混音确保效果。…

程序猿

2025年11月25日 • 用户投稿

0000

【第五期论文复现赛-语义分割】BiSeNet

BiSeNet是实时语义分割网络，针对常见加速方法损失空间信息等问题，提出双路径结构：Spatial Path保留高分辨率特征图，Context Path通过下采样增感受野，结合特征融合模块融合特征。在Cityscapes数据集复现中，以特定配置达75.19% mIoU，兼顾速度与性能。 ☞☞☞AI…

程序猿

2025年11月25日 • 用户投稿

0000