Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

音频生成领域又有好消息:刚刚,stability ai 宣布推出开放模型 stable audio open,该模型能够生成高质量的音频数据。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

项目地址:https://huggingface.co/stabilityai/stable-audio-open-1.0

与Stability AI的商业Stable Audio产品(可生成长达三分钟的更长、连贯的音乐曲目)不同,Stable Audio Open可通过简单的文本提供生成长达47秒的高质量音频数据。

这个模型是为音乐制作和声音设计而创建的。它包括鼓点、乐器riffs、环境音、拟声录音和其他用于音乐制作和声音设计的音频样本。虽然它可以生成简短的音乐片段,但它还没有针对完整的歌曲、旋律或人声进行优化。

Stable Audio Open 的主要优势在于,用户可以根据自己的自定义音频数据对模型进行微调。

比如,下方是鼓手根据自己的鼓声录音样本进行微调生成的新节拍:Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成生成森林中鸟儿唱歌的音频: Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成再生成一段「动次打次」的摇滚乐: Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成训练细节与数据集

Stable+Audio+Open是基于Transformer架构的潜在扩散模型。由三个组件组成:将波形压缩为可管理序列长度的自编码器、用于文本调节的基于T5的文本嵌入,以及在自编码器和文本嵌入中运行的基于Transformer的扩散(DiT)模型。这个模型的设计旨在在空间效率和语音生成质量之间取得平衡。

在内部的音乐生成器中,随着包括Stability在内的一些生成器越来越受欢迎,版权以及一些生成器创建者可能滥用版权的问题成为人们关注的焦点。然而,一些生成器创建者可以满用版权的方式成为人们关注的焦点。

在本次模型训练中,稳定性和人工智能会对训练数据的质量进行监测,以保证模型的稳定性。在文生图模型训练上的“版权问题”曾经让这家公司深陷争议之中。因此,Stable+Audio+Open使用来自FreeSound和Free Music Archive的音频数据进行训练,以确保没有使用任何受版权保护或专有的材料。这样可以确保任何使用Stable+Audio+Open的个人或机构都不会侵犯任何版权或专有权。

数据集共包含 486492 个音频记录,其中 472618 个来自 Freesound,13874 个来自 Free Music Archive 。所有音频文件均为 CC0、CC BY 或 CC Sampling+ 许可。这些数据用于训练自编码器和 DiT,此外研究者使用了公开的预训练 T5 模型(t5-base)进行文本调节。

在开始训练之前,研究者进行了深入分析,以确保训练数据中没有未经授权的版权音乐。

他们首先使用基于 AudioSet 类别的 PANNs 音乐分类器识别了 FreeSound 中的音乐样本。被识别的音乐样本中至少有 30 秒的音乐被预测为属于音乐相关类别,阈值为 0.15(PANNs 输出概率范围为 0 至 1)。

新CG儿 新CG儿

数字视觉分享平台 | AE模板_视频素材

新CG儿 412 查看详情 新CG儿

识别出的音乐样本被发送到 Audible Magic(一家值得信赖的内容检测公司)的识别服务,以确保不存在受版权保护的音乐。Audible Magic 标记了疑似受版权保护的音乐,这些会被删除,然后再对数据集进行训练。大部分被删除的内容都是现场录音,其中的背景音乐都是受版权保护的。经过上述处理后,研究者得到了 266324 个 CC0、194840 个 CC-BY 和 11454 个 CC 采样 + 音频记录。

最后要确保的是, FMA 子集中不存在受版权保护的内容。在这种情况下,程序略有不同,因为 FMA 子集中包含音乐信号。研究者根据大型版权音乐数据库进行元数据搜索,并标记任何可能匹配的内容,被标记的内容会由人工逐一审核。这一过程之后,最终获得了 8967 首 CC-BY 和 4907 首 CC0 音乐。

局限性

Stable Audio Open 1.0 作为一个音频生成模型,也有一些局限性,包括:

无法生成逼真的声音;

使用英语描述进行训练,在其他语言中的表现不会那么好;

不能适用于所有音乐风格和文化,训练数据缺乏多样性,模型可能无法在现有的各种音乐流派和声音效果上表现得同样好;

有时很难评估哪种类型的文本描述可以提供最佳的生成效果,可能需要进行工程设计才能获得令人满意的结果。

值得注意的是,Stable Audio Open 是一个开放模型,但是从技术上讲它不是开源的。Stable Audio Open 并未使用实际的开放源代码促进会 (OSI) 批准的许可证,而是根据 Stability AI 非商业研究社区协议许可证向用户提供。 

与此同时,Stable Audio Open 也不能用于商业用途;服务条款禁止这样做。而且,它在不同音乐风格和文化中的表现并不一样好,或者在使用英语以外的语言描述时也表现不佳。

Stability AI 将此归咎于训练数据。模型描述中写道:「数据源可能缺乏多样性,数据集中并非所有文化都具有同等代表性。模型生成的样本将反映训练数据的偏差。」

以上就是Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/794525.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月26日 15:24:41
下一篇 2025年11月26日 15:30:39

相关推荐

  • 如何使用JavaScript实现动态数据表格的搜索与过滤功能

    本教程将详细介绍如何通过javascript实现动态数据表格的搜索和过滤功能。我们将从api获取数据,将其存储在全局变量中,并利用数组的`filter()`方法根据用户输入进行实时或点击搜索,最终将匹配的数据呈现在html表格中。文章将涵盖数据获取、dom操作、事件监听以及代码结构优化等关键技术,旨…

    2025年12月23日
    000
  • JavaScript实现API数据搜索与动态表格展示

    本教程旨在指导如何使用javascript从api获取数据,并在网页表格中动态展示。核心内容包括数据全局存储、利用`array.prototype.filter()`方法实现高效的数据搜索功能,并根据用户输入实时更新表格内容,同时强调代码结构优化和大小写不敏感的搜索实现。 在现代前端应用中,从API…

    2025年12月23日
    000
  • JavaScript 实现动态表格搜索与 API 数据过滤教程

    本教程详细介绍了如何使用 javascript 在前端实现动态表格数据搜索功能。通过从 api 获取数据并将其存储在全局变量中,我们利用数组的 `filter()` 方法根据用户输入对数据进行实时过滤,并将匹配的结果动态呈现在 html 表格中,从而实现高效、用户友好的数据检索体验。 在现代 Web…

    2025年12月23日
    100
  • JavaScript客户端数据过滤:构建高效动态搜索栏

    本文详细介绍了如何使用javascript在客户端实现动态搜索栏功能,通过直接操作dom元素,高效地对已渲染的学生社区数据进行实时过滤。这种方法避免了不必要的api请求和数据重新渲染,显著提升了用户在大型列表或卡片展示中的搜索体验,确保了流畅且响应迅速的交互。 客户端数据过滤概述 在现代Web应用中…

    2025年12月23日 好文分享
    000
  • html中form的作用 html中form表单使用教程

    html 中的 以上就是html中form的作用 html中form表单使用教程的详细内容,更多请关注创想鸟其它相关文章!

    好文分享 2025年12月22日
    000
  • javascript_如何实现搜索引擎

    实现一个简单的搜索引擎需先准备数据源,如包含id、标题和内容的文档数组;接着编写搜索函数,将用户输入转为小写关键词数组,遍历每条文档的内容与标题,统计关键词出现次数并计算匹配得分;然后通过事件监听实时获取输入框内容,调用搜索函数并按得分降序排列结果;最后将匹配项以高亮形式展示在页面中,并可通过防抖优…

    2025年12月21日
    000
  • 在Google Apps Script中实现HTML表格多列动态过滤

    本教程详细介绍了如何在google apps script项目中,通过javascript实现html表格数据的多列动态过滤功能。文章将指导您如何修改现有代码,使其能够遍历表格的每一行和行内的所有单元格,判断输入文本是否存在于任一单元格中,从而精确地显示或隐藏匹配的行,有效解决了仅在单列搜索的局限性…

    2025年12月21日
    000
  • 在Google Apps Script中实现HTML表格多列筛选

    本教程将指导您如何在google apps script项目中,通过javascript修改html表格的筛选功能,使其能够跨所有列进行数据搜索,而非仅限于特定列,从而提升用户体验和数据检索的灵活性。我们将分析现有单列筛选代码的局限性,并提供一个优化方案,通过迭代行内所有单元格来执行全面的文本匹配,…

    2025年12月21日
    000
  • 如何使用 Alpine.js 重置多选框的所有选项

    本教程详细介绍了如何使用 Alpine.js 清除多选框(multiple select)的所有已选选项。核心方法是将 x-model 绑定的数据属性初始化并重置为一个空数组 [],从而实现多选框的清空操作。文章通过代码示例和专业讲解,帮助开发者高效管理多选框状态。 引言:多选框重置的常见需求 在现…

    2025年12月20日
    000
  • 如何在IntelliJ IDEA中高效查找YAML配置文件中的特定属性?

    在intellij idea中高效查找yaml配置文件中的特定属性是开发过程中常见且重要的任务。假设你需要在众多yaml文件中查找a.b.c.d.e这个属性,idea提供了一种高效的结构化数据搜索功能,帮助你快速找到所需的内容。以下是详细的操作步骤: 打开搜索窗口:使用快捷键Ctrl Shift F…

    2025年12月20日
    000
  • 在 IntelliJ IDEA 中如何高效查找 YAML 配置文件中的特定属性 a.b.c.d.e?

    在 intellij idea 中高效查找 yaml 配置文件中的特定属性 a.b.c.d.e 时,可以采用以下策略来简化搜索过程: 首先,利用 IDEA 的结构化数据搜索功能。具体操作如下: 按下 Ctrl + Shift + F(Windows/Linux)或 Command + Shift +…

    2025年12月20日
    000
  • 在 IntelliJ IDEA 中如何高效查找 YAML 文件中的特定属性 a.b.c.d.e?

    在使用 intellij idea 进行开发时,如何高效地查找 yaml 文件中的特定属性 a.b.c.d.e 是一个常见的问题。idea 提供了专门的结构化数据搜索功能,帮助开发者快速定位所需的属性。以下是两种有效的查找方法: 使用正则表达式搜索嵌套属性: 通过按下 Ctrl Shift F(Wi…

    2025年12月20日
    000
  • 本周 JavaScript 2

    javascript 不断发展。最新的重大更新 ecmascript 2023 (es14) 于 2023 年 6 月发布。此更新引入了多项新功能,增强了语言的功能并提高了开发人员的效率。 ecmascript 2023 的主要特性 1。顶级等待顶层await的引入允许开发者在模块的顶层使用awai…

    2025年12月19日
    000
  • c++怎么使用std::find和std::find_if算法_c++查找算法find用法详解

    std::find用于查找等于指定值的元素,返回匹配项迭代器或末尾;std::find_if通过谓词查找首个满足条件的元素,适用所有提供迭代器的容器,支持自定义类型与lambda表达式,时间复杂度O(n),适合无序数据搜索。 std::find 和 std::find_if 是 C++ 标准库中定义…

    2025年12月19日
    000
  • CS-第 3 周

    算法是解决问题的指令集,其执行速度和内存占用各不相同。编程中,许多算法都基于数据搜索和排序。本文将介绍几种数据检索和排序算法。 线性搜索 假设有一个数组 [20, 500, 10, 5, 100, 1, 50],需要查找数字 50。线性搜索算法会逐个检查数组中的每个元素,直到找到目标值或遍历完整个数…

    2025年12月18日 好文分享
    000
  • 如何在 IntelliJ IDEA 中高效查找 YAML 文件中的特定属性 a.b.c.d.e?

    在 intellij idea 中高效查找 yaml 文件中的特定属性 a.b.c.d.e 可以通过利用 idea 提供的结构化数据搜索功能来实现。这个功能不仅适用于 yaml 文件,还可以用于其他格式的配置文件。 具体操作步骤如下: 打开搜索窗口:按下 Ctrl Shift F(Windows/L…

    2025年12月15日
    000
  • 在Apiato框架中实现多字段组合搜索:以卡片详情为例

    本教程详细阐述了在apiato框架中,如何通过其强大的查询参数功能,特别是`search join`机制,实现对数据库中多个独立字段(如`first4`和`last4`)进行组合搜索,以满足用户输入单一逻辑概念(如`carddetails`)的需求。文章将指导读者配置repository并构建有效的…

    2025年12月13日
    000
  • PHP/SQL多词搜索实现:处理空格与安全优化指南

    本教程详细介绍了如何在php和sql中实现对表格数据的多词搜索功能,重点解决搜索关键词中包含空格时无法匹配的问题。文章将通过php `explode` 函数分割搜索词,并构建动态sql `where` 子句。更重要的是,将强调并演示如何使用预处理语句(prepared statements)来有效防…

    2025年12月12日
    000
  • JavaScript实现HTML表格多列搜索过滤功能

    本教程详细介绍了如何使用javascript为html表格实现多列数据过滤功能。通过修改传统的单列过滤逻辑,引入嵌套循环遍历行内所有单元格,并利用一个布尔标志判断行是否包含搜索关键词,从而实现对表格中任意列内容的综合搜索与显示控制。文章提供了完整的代码示例和实现细节,帮助开发者轻松扩展表格的搜索能力…

    2025年12月12日
    000
  • 在MySQL中高效查询存储在TEXT字段中的JSON数据

    本文详细阐述了如何在MySQL数据库的TEXT类型字段中查询存储的JSON数据。文章以实际案例为基础,重点介绍了JSON_EXTRACT和JSON_CONTAINS等核心函数的使用方法,并深入探讨了针对大规模数据集的性能优化策略,包括利用虚拟列和恰当的数据类型选择,旨在提供一套全面的JSON数据查询…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信