seed-tts
-
豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o
字节跳动旗下豆包大模型在2024年取得了令人瞩目的进展。自5月发布以来,仅用7个月时间,其在自然语言处理、视频生成、语音交互和图像理解等领域的能力便跻身国际领先水平。团队表示,豆包大模型仍处于发展初期,未来潜力巨大。 截至12月,最新版Doubao-pro-1215模型的综合能力提升了32%,全面达…
-
Qwen2.5-Omni-3B— 阿里 Qwen 团队推出的轻量级多模态 AI 模型
qwen2.5-omni-3b 是由阿里巴巴 qwen 团队推出的一款轻量级多模态 ai 模型。它是 qwen2.5-omni-7b 的精简版本,专门为消费级硬件设计,支持文本、音频、图像和视频等多种输入功能。参数量从 7b 减少到 3b,但仍能保持 7b 模型 90% 以上的多模态性能,尤其在实时…
-
豆包语音2.0— 字节跳动推出的升级版AI语音模型
豆包语音2.0是什么 豆包语音2.0是字节跳动推出的升级版ai语音模型,包含两大核心模型:豆包语音合成模型2.0(doubao-seed-tts 2.0)和豆包声音复刻模型2.0(doubao-seed-icl 2.0)。语音合成模型2.0支持对话式合成,可精准理解语义和情感,实现复杂公式朗读,准确…