蚂蚁百灵大模型团队开源高性能推理 MoE 模型 Ring-mini-2.0

蚂蚁百灵大模型团队开源高性能推理 moe 模型 ring-mini-2.0

蚂蚁百灵大模型团队今日正式推出 Ring-mini-2.0,这是一款基于 Ling-mini-2.0 架构深度调优的高性能推理型 MoE 模型(Thinking model)。该模型总参数量为 16B,实际推理时仅激活 1.4B 参数,便能实现与 10B 以下 dense 模型相当甚至更优的综合推理能力,尤其在逻辑推理、编程和数学任务中表现亮眼,同时支持 128K 长上下文输入,并具备高达 300+ token/s 的生成速度。

Ring-mini-2.0 以 Ling-mini-2.0-base 为起点,通过 Long-COT 监督微调、大规模 RLVR 训练以及 RLHF 联合优化等关键技术路径,持续强化其复杂推理的稳定性和跨任务泛化能力。在多个高难度评测基准(如 LiveCodeBench、AIME 2025、GPQA、ARC-AGI-v1 等)上,当输出长度一致时,其性能显著优于主流 10B 级别以下的 dense 模型,部分指标接近甚至媲美更大规模的 MoE 模型(例如 gpt-oss-20B-medium),尤其在逻辑推理维度展现出领先优势。

蚂蚁百灵大模型团队开源高性能推理 MoE 模型 Ring-mini-2.0

百灵大模型 百灵大模型

蚂蚁集团自研的多模态AI大模型系列

百灵大模型 177 查看详情 百灵大模型

目前,Ring-mini-2.0 已完成全面开源,包括模型权重、训练方法及数据构建方案均向社区开放,致力于推动高效推理模型的技术发展与应用落地。

HuggingFace:https://www.php.cn/link/3fcee1ea342699e1bf18973b242f9b65
ModelScope:https://www.php.cn/link/87ac1c683493632381219d10cf86cb2a

以上就是蚂蚁百灵大模型团队开源高性能推理 MoE 模型 Ring-mini-2.0的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/345849.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月5日 20:20:44
下一篇 2025年11月5日 20:21:56

相关推荐

发表回复

登录后才能评论
关注微信