小红书开源 FireRedTTS2,专为长对话设计的语音生成系统

小红书开源 fireredtts2,专为长对话设计的语音生成系统

小红书团队近日开源了名为 FireRedTTS2 的全新语音合成系统,专为多说话人场景下的长篇流式对话生成设计,致力于为播客内容创作与智能聊天机器人提供更加自然、连贯的语音输出体验。

主要特性包括:

支持长文本多角色对话:可生成最长 3 分钟的四人对话内容,并具备良好的扩展性,通过增加训练数据即可支持更长时间的对话及更多说话人。多语言能力强大:系统覆盖英语、中文、日语、韩语、法语、德语和俄语等多种语言,能够在跨语言交流或代码切换语境下实现零样本语音克隆,无需额外参考音频即可生成目标音色的语音。极致低延迟表现:依托 12.5Hz 的流式语音标记器与双 Transformer 架构,支持文本与语音标记的交错生成,实现逐句实时合成。首包响应延迟低至 140ms,在保证流畅性的同时维持高保真音质。合成稳定性优异:在独白与多人对话测试中均表现出高度的语音相似度以及较低的词错误率(WER)和字符错误率(CER),确保信息准确传达。支持随机音色生成:可用于构建多样化的语音交互训练数据集,提升语音识别与对话系统的鲁棒性。

目前,项目团队已公开技术论文与演示页面,并预告将于 10 月发布升级版多语言基础模型、完整的微调代码与使用教程,以及端到端的 text-to-blog 生成流程。

小红书开源 FireRedTTS2,专为长对话设计的语音生成系统

该项目代码已完整开源,附带详细的安装指南和使用示例,依赖 PyTorch 2.7.1 版本,模型权重已上传至 Hugging Face 平台,便于开发者快速集成与部署。

https://www.php.cn/link/23f38cc38c9291fec95487293bbed704
https://www.php.cn/link/100a527975525b513a983359a3c51378
https://www.php.cn/link/51540863fba76ac6cb10eded0ff9ef7b

源码地址:点击下载

以上就是小红书开源 FireRedTTS2,专为长对话设计的语音生成系统的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/111512.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月23日 15:21:25
下一篇 2025年11月23日 15:46:55

相关推荐

  • Web Development Job in 4

    简介 网络开发领域持续快速发展,为拥有适当技能和知识的个人提供了令人兴奋的机会。如果您想进入这个充满活力的行业或提升自己的职业生涯,这里有一些重要策略可以帮助您在 2024 年找到梦想的工作: 1. 掌握基本技能 编程语言:熟练掌握 JavaScript、Python、Ruby 或 PHP 等语言至…

    2025年12月19日
    000
  • 学习如何:useEFFECT 和 useSTATE,一个 REACT 应用程序

    我一直在开发一个名为“Heat”的网络应用程序,该应用程序的唯一目的是帮助我学习和应用 JavaScript 并改进我的 CSS,还有很多后端。我们的计划是创建一个具有视觉吸引力的网络应用程序,并具有一些有趣的功能。 在这个过程中我学到了什么: 前端是使用react js构建的,我选择react只是…

    2025年12月19日
    000
  • 太阳能系统挑战

    这是前端挑战 v24.09.04 的提交,Glam Up My Markup: Space 我建造了什么 我使用 CSS 网格创建了一个登陆页面,展示了每个部分中的所有项目。 演示 斯蒂芬妮-丹尼希.github.io 旅行 这是我完成的第一个这样的挑战。我想测试我的技能,看看在没有设计文件作为指导…

    2025年12月19日
    000
  • 处理问题

    我制作了explainer.js,一个用于处理文件并输出代码块和解释的 CLI 工具。如果您不知道文件中发生了什么,那么这可能会有所帮助。使用 Commander.js 和 Groq SDK 构建!看看@ https://github.com/aamfahim/explainer.js 即时响应 为…

    2025年12月19日
    000
  • 如何使您的 React 应用程序更快:性能提示和最佳实践

    啊,反应!我们喜爱的用于构建 ui 的库。它就像一剂神奇的药剂,让我们的网络应用程序感觉具有交互性和快速性——直到有一天,它却没有了。突然,你注意到事情变慢了。点击按钮就像用信鸽寄信一样。您的应用程序从快如闪电变成了慢吞吞,用户开始给您“看”。 不过别担心!就像咖啡可以解决大部分生活问题一样(或者我…

    好文分享 2025年12月19日
    000
  • 介绍邱!

    我很高兴地宣布发布 qiu – 一个严肃的 sql 查询运行器,旨在让原始 sql 再次变得有趣。老实说,orm 有其用武之地,但当您只想编写简单的 sql 时,它们可能会有点让人不知所措。我一直很喜欢编写原始 sql 查询,但我意识到我需要练习——大量的练习。这就是qiu登场的地方。 有了 qiu…

    2025年12月19日
    000
  • 反思我的旅程:构建初学者房地产列表全栈应用程序

    当我第一次开始学习 python 时,我不知道这段旅程会带我走向何方。我记得深入研究 python 教程,努力学习循环、函数和面向对象编程等基本概念。快进到今天,我使用 flask 后端和 react 前端的组合构建了一个全栈房地产列表应用程序。这个项目不仅是一个挑战,也是一次令人难以置信的学习经历…

    2025年12月19日
    000
  • 上传一个简单的应用程序并在 4 时间内获利有多困难?

    在大约一个小时内,我能够创建页面、开发服务器、连接到 Google AdSense 并购买域名。凭借 HTML、CSS、Bootstrap、Node.js、JavaScript、Git 和可用工具的基本知识,我实现了这一结果。 我使用 Bootstrap 开发了一个 HTML 页面,并使用 GitH…

    2025年12月19日
    000
  • “星际之旅:设计融合美学与创新的太空主题网络体验”

    这是前端挑战 v24.09.04 的提交,Glam Up My Markup: Space 我建造了什么 对于本次前端挑战 v24.09.04,我创建了一个动态且具有视觉吸引力的登陆页面,重点关注太空探索主题。目标是设计一种时尚、现代的互动体验,邀请用户深入探索宇宙的奥秘。我的目标是将充满活力的图像…

    2025年12月19日
    000
  • 掌握 Git:如何删除本地、合并和远程分支

    在软件开发领域,有效的版本控制对于确保顺利协作和项目管理至关重要。 Git 是使用最广泛的版本控制系统之一,了解如何有效地处理分支可以节省时间并防止错误。 在本文中,我们将探讨如何管理本地、合并和远程 Git 分支,重点关注有助于简化工作流程的命令。 删除本地 Git 分支 在处理项目时,通常会为特…

    2025年12月19日
    000
  • RemoveCookieWall,Firefox 扩展

    您是否厌倦了网站上流行的横幅,以便您接受第三方 cookie 或结账?在这篇文章中,我解释了如何制作(并发布)一个 firefox 扩展以避免大多数网站出现这种情况 信息 此扩展的代码发布于 https://github.com/jagedn/removecookiewall-addon您可以从 h…

    2025年12月19日
    000
  • Nodejs 版本管理器终极指南:NVM、NVS、fnm、Volta 和 asdf |第 1 部分

    介绍 嘿!如果您曾经使用 node.js 进行过开发,您就会明白,对于项目来说,经常需要使用不同的版本。也许一个项目可以在版本 10 上运行,另一个项目可以在版本 14 上运行,而一个新项目需要最新版本,比如 20。随着每个新版本的新功能的出现,一系列新的挑战也随之出现。这些是与库和框架的兼容性、新…

    2025年12月19日
    000
  • useSyncExternalStoreExports 状态源码解释

    在本文中,我们将了解 zustand 如何在其[源代码]中使用 usesyncexternalstoreexports。 usesyncexternalstoreexports 是从 use-sync-external-store/shim/with-selector 导入的。 use-sync-e…

    2025年12月19日
    000
  • 太阳之路 – 让我的标记更加迷人

    这是前端挑战 v24.09.04 的提交,Glam Up My Markup:Space 我建造了什么 探索太阳系:发现行星 这是一个允许用户探索行星、了解其独特功能并踏上太阳系虚拟旅程的网站。 演示 演示链接 – https://rayx81194.github.io/space/Gi…

    2025年12月19日
    000
  • Qopy:作为开发人员我最喜欢的剪贴板管理器

    作为一名开发人员,我一直在寻找可以使我的工作流程更顺畅、更高效的工具。最近,我偶然发现了 Qopy,一个可以在 Linux 和 Windows 上运行的开源剪贴板管理器。 什么是Qopy? Qopy 是一个简单的剪贴板管理器,旨在改进标准剪贴板体验。它的设计宗旨是用户友好、可靠且快速。 为什么这么好…

    2025年12月19日
    000
  • 开发人员人工智能入门:揭秘基础知识部分

    开发者们大家好! 人工智能不再只是一个梦想。它就在这里并改变我们构建软件的方式。它可以使应用程序更好、更有用。但如何开始在项目中使用人工智能呢? 本系列旨在为您提供踏上人工智能开发之旅的基础知识。在第一部分中,我们将深入研究核心概念并提供使用 langchain 和 openai 的实践示例。 揭秘…

    2025年12月19日
    000
  • 如何掌握 MERN 堆栈:全栈开发人员指南

    MERN 堆栈(MongoDB、Express.js、React.js、Node.js)已成为全堆栈 Web 开发最流行的技术之一。作为一名开发人员,学习 MERN 堆栈可以打开一个充满机遇的世界,并让您走上构建强大的动态 Web 应用程序的道路。以下是您如何掌握 MERN 堆栈并将您的全堆栈开发技…

    2025年12月19日
    000
  • 免费接龙

    很久以前,在同一个星系中,我开始尝试制作 freecell,作为学习 angular 1.3 的一种方式。 我已经走了这么远,然后我就被其他事情分散了注意力,就像副项目一样。 我最近有一些空闲时间(我知道,我也没想到),所以我想我应该再试一次。 我基本上是从头开始,因为我对 angular 1.3 …

    好文分享 2025年12月19日
    000
  • 使用 React 构建笑话生成器

    介绍 在本教程中,我们将指导您使用 react 构建一个简单而有趣的笑话生成器。这个项目非常适合想要练习在 react 中处理 api 请求并管理功能组件中的状态的初学者。 项目概况 这个笑话生成器从 api 中获取随机笑话,并在用户单击按钮时将其显示在屏幕上。它具有干净简约的用户界面,使其易于交互…

    2025年12月19日 好文分享
    000
  • 星球大战主题太阳系指南 – 魅力我的标记:

    这是前端挑战 v24.09.04 的提交,Glam Up My Markup: Space 我建造了什么 探索太阳系:受星球大战启发的银河之旅 想象一下,偶然发现一本来自遥远星系的传奇旅游手册——一本关于被称为太阳系的神秘恒星系统的指南。本着星球大战宇宙的精神,这个项目将我们自己的天体社区变成了冒险…

    2025年12月19日
    000

发表回复

登录后才能评论
关注微信