seed-tts

  • 豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o

    字节跳动旗下豆包大模型在2024年取得了令人瞩目的进展。自5月发布以来,仅用7个月时间,其在自然语言处理、视频生成、语音交互和图像理解等领域的能力便跻身国际领先水平。团队表示,豆包大模型仍处于发展初期,未来潜力巨大。 截至12月,最新版Doubao-pro-1215模型的综合能力提升了32%,全面达…

    2025年11月6日 科技
    000
  • Qwen2.5-Omni-3B— 阿里 Qwen 团队推出的轻量级多模态 AI 模型

    qwen2.5-omni-3b 是由阿里巴巴 qwen 团队推出的一款轻量级多模态 ai 模型。它是 qwen2.5-omni-7b 的精简版本,专门为消费级硬件设计,支持文本、音频、图像和视频等多种输入功能。参数量从 7b 减少到 3b,但仍能保持 7b 模型 90% 以上的多模态性能,尤其在实时…

    2025年11月4日 科技
    100
  • 豆包语音2.0— 字节跳动推出的升级版AI语音模型

    豆包语音2.0是什么 豆包语音2.0是字节跳动推出的升级版ai语音模型,包含两大核心模型:豆包语音合成模型2.0(doubao-seed-tts 2.0)和豆包声音复刻模型2.0(doubao-seed-icl 2.0)。语音合成模型2.0支持对话式合成,可精准理解语义和情感,实现复杂公式朗读,准确…

    2025年11月1日
    000
关注微信