蚂蚁百灵团队开源高效推理模型 Ring-mini-sparse-2.0-exp

蚂蚁百灵大模型团队近日正式开源了高效推理模型 ring-mini-sparse-2.0-exp,该模型基于全新设计的 ling 2.0 架构,专为长序列解码任务优化,创新性地结合了高稀疏度的 mixture of expert(moe)结构与稀疏注意力机制

据团队介绍,通过架构与推理系统的深度协同优化,该模型在处理复杂长序列推理任务时,吞吐量相较原始版本 Ring-mini-2.0 提升近 3 倍。同时,在多个高难度推理基准测试中持续保持领先水平(SOTA),为开源社区提供了一种兼具高性能推理效率和强大上下文理解能力的轻量级解决方案。

蚂蚁百灵团队开源高效推理模型 Ring-mini-sparse-2.0-exp

Ling 2.0 Sparse 架构的提出,旨在应对大语言模型发展的两大关键趋势:上下文长度扩展(Context Length Scaling)与测试时扩展(Test Time Scaling)。该机制通过高效的稀疏注意力设计,显著提升了模型在长文本场景下的运行效率。

蚂蚁百灵团队开源高效推理模型 Ring-mini-sparse-2.0-exp

该方案借鉴了 Mixture of Block Attention (MoBA) 的思想,采用块级稀疏注意力(block-wise sparse attention),将输入的 Key 和 Value 按照块进行划分。每个 query 在 head 维度上仅选择 top-k 个关键块参与注意力计算,大幅降低整体计算量。此外,该设计进一步融合了 Grouped Query Attention (GQA),使同一组内的多个 query heads 共享相同的 top-k 块选择结果,从而实现一次块读取服务多个 head,有效减少内存访问开销(I/O cost)。

Ring-mini-sparse-2.0-exp 开源地址:
Hugging Face:https://www.php.cn/link/a082c0a47eb5379353243b15bf77c560
ModelScope:https://www.php.cn/link/f3a3d61b07332233ac57e4f232725e18
GitHub:https://www.php.cn/link/3310199d4a42bc84d71ce62d2d260379

以上就是蚂蚁百灵团队开源高效推理模型 Ring-mini-sparse-2.0-exp的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/193495.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月1日 17:00:35
下一篇 2025年11月1日 17:01:20

相关推荐

  • Axios 已经过时了吗?了解新一代请求工具

    嘿那里!今天我想和大家分享一个非常让我感动的话题——自动重试请求策略。这个功能对我来说绝对是救星!在处理网络请求时,尤其是在不稳定的网络环境中,自动重试策略成为了我值得信赖的伴侣。它使我的应用程序更加强大,并显着改善了用户体验。今天,我很乐意向您介绍 alovajs 中的自动重试请求策略 &#821…

    2025年12月19日
    000
  • 豆瓣电影搜索影院悬浮框自动收起是如何实现的?

    解决豆瓣电影搜索影院悬浮框自动收起问题 在浏览豆瓣电影时,用户可能会遇到这样的情况:点击“影院”后出现搜索框悬浮框,而当点击悬浮框外的区域时,该悬浮框会自动隐藏。本文将探究实现这一效果的方法。 一个可行的解决方案是给 body 绑定一个 click 事件,然后在事件处理程序中检查点击的目标节点是否包…

    2025年12月19日
    000
  • 已上线项目图片懒加载:如何高效添加 data-src 属性?

    为已上线项目的图片添加 data-src,如何优化? 问题: 项目上线后,想要添加图片懒加载功能,如何高效地为页面中现有的图片添加 data-src 属性?一种常见的做法是遍历页面上的所有 img 元素,但这样做效率较低。 解决方案: 为了更有效地添加 data-src 属性,可以使用更巧妙的方法:…

    2025年12月19日
    000
  • 恭喜 Wix Studio 挑战:社区版获胜者!

    等待结束了!是时候宣布 wix studio 挑战赛:社区版的获胜者了。 从国际象棋爱好者和宝石社区到企业家和设计师的专业社区,我们喜欢了解参与者梦想社区平台背后的个性和动机。 感谢 Ania Kubów 承担了为此次挑战选出一位获胜者的艰巨任务。 恭喜… @schemetastic 致力于构建 K…

    2025年12月19日
    000
  • 您的会话已过期!

    好吧,今天我们讨论“会话过期”的概念,特别是当您在项目中使用 nextauth.js 时。用简单、友好的语言来理解,以免产生混乱。 所以,首先让我们了解“您的会话已过期”错误的含义。这是一个 身份验证相关错误,在用户的登录会话终止时出现。例如,您登录了一个网站或应用程序,使用了一段时间,然后离开了一…

    2025年12月19日
    000
  • 动态语言中静态类型的讽刺

    c++kquote>您也可以在 medium 上阅读这篇文章。 当我们看到编程语言如何随着时间的推移而演变时,总是很有趣。 曾几何时,当我开始进入软件开发世界时,python、php 和 javascript 等动态语言因其灵活性和适合快速开发的简洁语法而受到赞赏。 然而,随着这些弱类型语言的…

    2025年12月19日
    000
  • 您可能不知道的 useState 性能技巧

    假设我们有一个包含 usestate 的 react 组件。 const expensivecalculation = () => { // …}export default function aboutpage() { const [state, setstate] = usestate…

    2025年12月19日
    000
  • 教育技术平台:尖端的数字大学网站模板

    这是 Wix Studio 挑战赛:社区版的提交内容。 我的社区平台 推出 Edu-Tech 平台 – 一个完全响应式、设计简洁的数字大学模板,专为旨在提供动态学习环境的教育机构量身定制。该模板旨在营造一种社区驱动的氛围,让学生可以学习任何类型的学习计划、获得证书和徽章,并与同龄人和导师…

    2025年12月19日
    000
  • Flexbox下拉框消失问题:如何解决点击分页后下拉框无法收起?

    flexbox下拉框消失问题 在使用flexbox的下拉框组件时,遇到这样的问题:下拉框显示后点击分页,再点击空白区域时,下拉框无法收起。这个问题要如何解决? 以下是提供的代码片段:     ******        —————-function fzflexbox(){   …

    2025年12月19日
    000
  • useReducer 以及它与 useState 的不同之处

    目录 简介何时使用 usestate何时使用 usereducer示例 1:带有 usestate 的计数器应用示例 2:使用 usereducer 的计数器应用示例 3:使用 usereducer 处理表单输入示例 4:使用 usereducer 构建测验应用程序usestate 和 usered…

    2025年12月19日 好文分享
    000
  • 如何用JavaScript正则表达式精准匹配特定class属性的li标签?

    js正则匹配div问题 问题: 如何使用javascript正则表达式匹配以下html中的li标签,该标签具有class属性“n-item n-item-ad spread-item news-item”? @@##@@立即学习“Java免费学习笔记(深入)”;……… 尝试的正则表达式:…

    2025年12月19日
    000
  • 全栈开发演变:趋势和最佳实践

    在过去的十年里,全栈开发发生了很大的变化。从对能够处理后端和前端任务的开发人员的不同寻常的责任到成为行业标准,这确实是一段奇怪的旅程。 如今,成为一名全栈开发人员不仅仅意味着兼顾应用程序的两个方面。它涉及掌握一系列技术并通过遵循最佳实践来适应最新趋势。让我们深入了解全栈开发的演变过程、引领全栈开发步…

    2025年12月19日
    000
  • 类型实用程序 – JavaScript 挑战

    介绍 检查类型是日常编码和技术面试中 javascript 的常见做法。 您可以在 github 上找到这篇文章中的所有代码。 原始值 在 javascript 中,除 object 之外的所有类型都定义直接在语言最低级别表示的不可变值。我们将这些类型的值称为原始值。 有 7 个原始值: 立即学习“…

    2025年12月19日
    000
  • JavaScript 中解构赋值的强大示例

    解构赋值是 es6 中引入的一种语法糖,它允许您将数组或对象中的值解压到变量中。它可以显着简化您的代码并使其更具可读性。 解构数组 基本示例: const numbers = [1, 2, 3, 4];const [first, second, …rest] = numbers;console.…

    2025年12月19日
    000
  • 使用 JavaScript 升级您的前端:超越基础

    JavaScript 已经从一种简单的脚本语言发展成为交互式和动态 Web 体验的支柱。 如果您希望超越基础知识并真正掌握前端开发,以下是如何利用 JavaScript 的力量: DOM 操作: 文档对象模型 (DOM) 是您的游乐场。 掌握 DOM 操作可以让你: 动态内容更新:无需重新加载页面即…

    2025年12月19日
    000
  • 使用 html css 和 javascript 制作太阳和月亮动画

    Day-Night Toggle body, html { margin: 0; padding: 0; height: 100vh; display: flex; justify-content: center; align-items: center; font-family: Arial, s…

    2025年12月19日 好文分享
    000
  • 如何实现豆瓣电影搜索影院悬浮框自动隐藏?

    豆瓣电影搜索影院悬浮框的实现 在浏览豆瓣电影网站时,右上角搜索影院功能呈现了 intéressante 的交互效果。点击“广州”后出现的悬浮框,在点击悬浮框以外的区域时会自动隐藏。 解决此问题的方法是为 body 元素绑定一个点击事件监听器。该事件处理程序将检查点击目标是否包含在悬浮框内。如果不是,…

    2025年12月19日
    000
  • 豆瓣电影网页影院搜索框是如何实现自动隐藏效果的?

    豆瓣电影网页影院搜索框自动隐藏效果 在豆瓣电影网页上,当用户点击“广州”显示影院列表后,点击列表之外任意区域,列表即可自动隐藏。实现这一效果的方法如下: 对于此问题,一般做法是使用 javascript 或 jquery 等框架在 body 元素上绑定一个 click 事件监听器。当点击事件触发时,…

    2025年12月19日
    000
  • 出身卑微

    我叫利亚姆,今年 27 岁。 我一生都在努力寻找激情或动力来推动我想要成为某事并做某事。 老实说,我在学校经历了很多挣扎。我一直在拖延,但害怕失败,所以我会因为恐惧而做得足够好,但无法专注于生活中正确的事情。这让我感到发育不良、困惑和迷失在生活中。我以为每个人都有这样的感觉,而我只是落后了。 像这个…

    2025年12月19日
    000
  • JavaScript 中的生成式人工智能? Microsoft 的 GenAIScript、Svelte Nextjs 等

    欢迎来到新版“本周 JavaScript ”! 今天,我们从 Microsoft 获得了一些改变游戏规则的更新,即期待已久的 Svelte 5 版本和新的 Next.js 15 版本 – 还有更多!  微软GenAIScript 2024 年都是关于人工智能的,而 Microsoft 正…

    2025年12月19日
    000

发表回复

登录后才能评论
关注微信