udio

  • 用PaddleClas完成不平衡数据集多标签分类

    本项目针对不平衡自然场景图片数据集的多标签分类任务,解决了数据分布不平衡及类标签依赖的难题。使用PaddleClas套件,通过过采样处理数据不平衡,用powerlabel区分多标签组合,基于MobileNetV1模型,采用带pos_weight参数的binary cross entropy with…

    2025年11月10日 科技
    000
  • Step-Audio-EditX— 阶跃星辰开源的音频编辑大模型

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Step-Audio-EditX 是由阶跃星辰推出的全球首个达到大语言模型(LLM)级别的开源音频编辑大模型。它首次实现了在“情感、说话风格、副语言”三个维度上的细粒度、可迭代控制,能够自由调节…

    2025年11月10日
    000
  • 从视音角度看多模态学习的过去与未来

    视觉和听觉在人类的沟通和场景理解中至关重要。为了模仿人类的感知能力,旨在探索视音模态的视音学习在近些年来已成为一个蓬勃发展的领域。本文是对由中国人民大学高瓴人工智能学院GeWu-Lab联合德克萨斯州大学达拉斯分校以及西北工业大学共同发布的最新视音学习综述《Learning in Audio-visu…

    2025年11月10日 科技
    000
  • 第九届“泰迪杯”数据挖掘挑战赛:岩石样本的智能识别分享

    针对第九届“泰迪杯”数据挖掘挑战赛B题,本文提出岩石样本智能识别方案。对岩性识别,采用EfficientNet等深度学习模型,经数据增强处理样本,通过并行网络提升性能;对含油面积计算,基于荧光图像,利用OpenCV处理三通道像素,经阈值分割等步骤得出占比,为岩石分析提供支持。 ☞☞☞AI 智能聊天,…

    2025年11月10日 科技
    100
  • 盘点几款AI作图工具,让你不再为找图而烦恼

    huggingface[1] huggingface 是一家美国 AI 公司,它提供了开发使用机器学习构建应用程序的工具。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 它提供了构建自然语言的 Transformers 库,允许用户共享模型…

    2025年11月10日 科技
    000
  • 扩散模型爆火,这是首篇综述与Github论文分类汇总

    本综述(Diffusion Models: A Comprehensive Survey of Methods and Applications)来自加州大学 & Google Research 的 Ming-Hsuan Yang、北京大学崔斌实验室以及 CMU、UCLA、蒙特利尔 Mila…

    2025年11月10日 科技
    100
  • 这段音频火爆外网!文字、图片一键生成逼真音效,音频界AIGC来了

    近期 AIGC 如同上了热搜一般,火热程度居高不下,当然除了名头格外响亮,突破也是绝对斐然:输入自然语言就可自动生成图像、视频甚至是 3D 模型,你说意不意外? 但在音频音效的领域,AIGC 的福利似乎还差了一些。主要由于高自由度音频生成需要依靠大量文本 – 音频对数据,同时长时波形建模…

    2025年11月10日 科技
    000
  • 部署国产ChatGPT仅需6G显存!ChatYuan模型开放下载:业内首个功能型对话开源中文大模型

    前段时间,元语智能开发团队训练了一个类似ChatGPT的功能型对话大模型ChatYuan,并在网页版中开放了试玩接口。 现在你也可以在自己的机器上部署一个ChatYuan了! 模型可用于问答场景,能够结合上下文做对话、做各种生成任务,包括创意性写作,也能回答法律、新冠等领域类问题。 并且在全中文任务…

    2025年11月10日 科技
    000
  • PyTorch 2.0正式版发布!一行代码提速2倍,100%向后兼容

    PyTorch 2.0正式版终于来了! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 去年12月,PyTorch基金会在PyTorch Conference 2022上发布了PyTorch 2.0的第一个预览版本。 跟先前1.0版本相比,2…

    2025年11月10日 科技
    000
  • 【AI达人训练营第三期】手工搭建Resnet101分类道路情况

    本文介绍基于ResNet101神经网络的道路垃圾识别项目。先说明智慧环卫背景及项目意义,接着阐述数据集处理过程,包括解压缩、分离训练集与测试集、预处理及自定义数据集,还讲解了ResNet101网络搭建、训练(优化器、损失函数及训练过程)与预测阶段的实现,可减少环卫劳动力。 ☞☞☞AI 智能聊天, 问…

    2025年11月10日 科技
    300
关注微信