国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

国内规模最大开源模型来了:

参数650亿、基于2.6-3.2万亿token训练。

排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,现在就能无条件免费商用

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

它就是来自深圳元象公司的XVERSE。

根据算力、资源限制和具体任务需求的不同,我们能对它进行任何自由修改或蒸馏。

除了规模大,它还具有16k上下文,支持40多种语言,并还有7B、13B两个版本可选。

具体什么来头?

国内规模最大的可商用大模型来了

研究表明,参数量越高,高质量训练数据越多,大模型性能才能不断提升。

而业界普遍共识是达到500到600亿参数门槛,大模型才能“智能涌现” ,在多任务中展现强大性能。

但训练此量级模型成本高昂,技术要求较高,目前主要为闭源付费提供。

在国外开源生态中,Llama2-70B和Falcon-180B等标杆模型为“有条件”开源,设置了月活跃用户数或收入等商用上限,并因缺乏训练数据在中文能力上有明显短板。

在此,为推动国产大模型开源生态与产业应用发展,元象XVERSE公司宣布开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。13B模型则全面升级,提高“小”模型能力上限。

元象XVERSE创始人姚星表示:“面对研发时间紧、算力持续短缺等挑战,团队在三个月内研发出多款高性能7B、13B模型,并最早为社区献上一个‘大有可为’的65B模型。”

XVERSE-65B底座模型在2.6万亿Tokens的高质量数据上从头训练,上下文窗口扩展至16K,支持中、英、俄、法等40多种语言。

显著提升了三方面能力

一、理解、生成、推理和记忆等基础能力,到模型的多样性、创造性和精度表现,从优异到强大;

二、扩展了工具调用、代码解释、反思修正等能力,为构建智能体(AI Agent)奠定技术基础,提高模型实用性;

三、显著缓解7B、13B中常见且可能很严重的幻觉问题,减少大模型“胡说八道”,提高准确性和专业度。

元象大模型系列均为全自研,涵盖多项关键技术与研发创新:

1、复杂分布式系统设计:

天工大模型 天工大模型

中国首个对标ChatGPT的双千亿级大语言模型

天工大模型 115 查看详情 天工大模型

借鉴团队研发腾讯围棋AI“绝艺”、王者荣耀AI“绝悟”等大系统上的丰富经验,自研高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台与框架协同等关键技术,打造高效稳定的训练系统, 千卡集群峰值算力利用率达58.5%,位居业界前列。

2、全面提升性能:

65B训练中采用 FlashAttention2加速计算, 3D并行基础上采用虚拟流水线(virtual pipeline)技术,降低较长流水线产生过高气泡率,提升计算推理效率;上下文窗口长度从8K逐步提升到16K,使其不仅能出色完成复杂任务,包括长文理解、长文生成和超长对话,还拓展了工具调用、代码解释及反思修正能力,能更好构建智能体(AI Agent)。

3、极致提升训练稳定性:

因计算量庞大,通信拥塞、芯片过热或计算节点故障成为65B训练常态,初期出现过一周最高八次故障的情况。

通过集群基础设施运营、资源调度、训练框架和调度平台协同等持续优化,元象打造出高稳定、低中断、强容错的训练系统,将每周有效训练率提升至98.6%。

此外,在接近1.6万亿Tokens的模型训练中期,损失函数产生了NaN值,可能导致训练中断。

通常情况下,业界一般会在分析后删除与之相关的数据区间。

而团队根据经验判定这是模型自然演化,选择不删除数据,直接跳过相关参数更新,最终 NaN值 问题解决。

后期对参数值、激活值、梯度值等中间状态的进一步分析表明,该问题可能与模型最后一层transformer block激活值的最大值变化有关,并会随最大值的逐渐降低而自行解决。

国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

性能媲美GPT3.5

为确保业界能对元象大模型性能有全面、客观、长期认知,研究人员参考了一系列权威学术测评,制定了涵盖问答、理解、知识、推理、数学、代码等六个维度的11项主流权威测评标准,将持续使用并迭代。

XVERSE-65B在国内尚无同量级模型可对比,在与国外标杆对比测评中,部分指标超越、综合性能媲美GPT3.5;全面超越开源标杆Llama2-70B 和Falcon-180B;与GPT4仍有差距

国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

全面升级的XVERSE-13B-2,比同尺寸模型增加大量高质量数据,训练数据高达3.2万亿, 极大提升了“小”模型的能力上限。

它文理兼修,保持了文科优势,问答提升18%,理科长足进步, 代码提升149%、数学提升198%,在测评中全面超越了Llama2、Baichuan2等国内外开源标杆。

国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

现在,元象大模型可在Github、Hugging Face、魔搭ModelScope等多平台搜索“XVERSE”下载,简单登记后即可无条件免费商用,能满足中小企业、科研机构和个人开发者绝大部分的应用与迭代需求。

元象同时提供模型训练、推理、部署、精调等全方位技术服务,赋能文娱、金融、医疗等各行各业,帮助在智能客服、创意写作、精准推荐等多场景打造行业领先的用户体验。

2023年10月, 腾讯音乐率先宣布与元象大模型建立战略合作 ,共同推出lyraXVERSE加速大模型、全面升级其音乐助手“AI小琴”,未来还将持续探索AI与3D前沿技术。

以上就是国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/470155.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 07:13:10
下一篇 2025年11月8日 07:14:04

相关推荐

  • html的盒模型详解

    这次给大家带来html的盒模型详解,使用html盒模型的注意事项有哪些,下面就是实战案例,一起来看一下。 1.1. 盒的内容区的尺寸— content width和content height —取决于几个因素: –生成该盒的元素是否设置了’width’或&#82…

    好文分享 2025年12月21日
    000
  • 开源 C++ 框架如何利用社区贡献提升可扩展性和维护性?

    开源 c++++ 框架利用社区贡献增强可扩展性和可维护性:可扩展性:添加新功能模块化设计可插件架构可维护性:改进文档修复错误代码审查实战案例: boost 库通过社区贡献,扩展了新库,持续维护现有库,提供了广泛的文档,提升了可扩展性和可维护性。 开源 C++ 框架を活用:利用社区贡献增强可扩展性和可…

    2025年12月18日
    000
  • 深度了解开源和商业C++框架之间的差异,以做出最佳选择

    在选择 c++++ 框架时,开源和商业选项的区别在于:许可证:开源框架免费且可修改,而商业框架通常受限。支持:开源框架依靠社区支持,而商业框架提供付费专业帮助。特性:开源框架特性广泛,但稳定性各异,而商业框架通常经过维护,功能可靠。成本:开源框架免费,而商业框架需要许可费用,价格可能很高。根据项目需…

    2025年12月18日
    200
  • C++开源框架与商用框架有何异同?

    商用框架需要购买许可证且拥有专业支持,而开源框架免费且可自定义,具备广泛的社区支持。差异还包括:许可证限制:开源框架更宽松,而商用框架更严格。安全性:商用框架通常经过更严格的测试和审核。认证:某些商用框架已通过行业认证。 C++ 开源与商用框架对比 引言 在现代 C++ 开发中,框架已成为必不可少的…

    2025年12月18日
    000
  • 开源 C++ 框架与商业 C++ 框架的最佳实践有何不同?

    开源和商业 c++++ 框架的最佳实践取决于以下关键差异:许可:开源框架使用免费和开源许可证,允许修改和分发,而商业框架受专有许可证限制。支持:开源框架依赖社区支持,而商业框架提供官方支持和服务。定制:开源框架更具可定制性,而商业框架提供预先构建的组件。价格:开源框架免费,而商业框架需要付费许可证。…

    2025年12月18日
    000
  • 开源C++框架与C++库的区别

    框架提供结构和预建组件,加快开发但限制灵活性。库提供特定功能的实现,扩展功能而不影响结构。例如,qt 框架简化了 gui 开发,而 opencv 库提供了计算机视觉功能。 开源 C++ 框架与库的区别 在软件开发中,框架和库是两种不同的概念。两种工具都可以在加快开发时间和提高代码质量方面发挥重要作用…

    2025年12月18日
    000
  • C++框架的开源与商业模式演变趋势如何?

    c++++ 框架开源与商业模式趋势:开源框架兴起,提供免费且强大的工具。商业框架适应竞争,提供附加功能和支持。混合模型流行,结合开源框架和商业附加组件。qt 作为案例,同时提供开源和商业许可选项。应对策略:评估选项、考虑混合模型、与社区互动。 C++ 框架开源与商业模式演变趋势 引言 开源 C++ …

    2025年12月18日
    000
  • 开源C++框架 vs 商业C++框架:专业人士解读

    开源 C++ 框架与商业 C++ 框架:专业人士的视角 在 C++ 应用开发的世界中,开源和商业框架之间存在着激烈的竞争。每个阵营都有其优缺点,并且根据具体项目要求进行明智的选择至关重要。 开源 C++ 框架 优点: 免费且社区支持丰富高度可定制和灵活可见性高,文档齐全 缺点: 可能缺乏专业支持社区…

    2025年12月18日
    000
  • 如何对比不同C++框架的开源性和商业许可模型?

    了解 c++++ 框架的开源性和商业许可模型至关重要:研究开源许可证:框架通常使用 apache 2.0、mit 等开放源代码许可证。了解许可协议以确保符合项目要求。考虑商业许可证:商业许可证授予额外权利和支持,需要支付费用,但可能包括技术支持和定制开发。对比不同框架:通过比较表格了解特定 c++ …

    2025年12月18日
    300
  • 开源和商业C++框架对比:究竟有何优劣?

    开源和商业 c++++ 框架各有优劣:开源框架:免费,社区支持,可定制,支持新技术,但技术支持有限,质量控制受限,许可限制。商业框架:提供全面支持,稳定可靠,组件预配置,企业级支持,但价格昂贵,源代码封闭,供应商锁定。选择建议:开源框架适合需要定制、技术支持要求不高、预算有限的项目;商业框架适合稳定…

    2025年12月18日
    000
  • 开源C++框架与商业C++框架:成本效益分析

    对于 c++++ 框架,开源框架免除前期费用和提供无限次使用,而商业框架则需支付许可或订阅费。开源框架功能有限但可定制,商业框架功能丰富但灵活性较差。初创公司和需要定制的企业倾向于开源框架,而企业机构和需要广泛功能的企业倾向于商业框架。 开源与商业 C++ 框架的成本效益分析 在选择 C++ 框架时…

    2025年12月18日
    000
  • 深度剖析:开源C++框架和商业C++框架的优劣势

    开源框架的优点是成本节约、灵活性、社区支持和透明度,而缺点是技术支持有限、质量不可靠和安全性问题。商业框架的优点是全面的技术支持、更高的质量和可靠性、针对性优化,而缺点是许可费用、限制性许可和供应商锁定。具体选择取决于项目需求,开源框架提供成本节约和灵活性,而商业框架提供全面的支持和可靠性。 深入分…

    2025年12月18日
    000
  • 从业者视角:开源C++框架与商业C++框架对比

    从开发者的角度来看,开源c++++框架因其免费、可定制且社区支持活跃而受青睐。商业c++框架则以官方支持、完善文档和经过验证的质量取胜,但也需要支付许可费并限制可定制性。在选择时,小型项目、研究项目或熟练团队更适合开源框架,而企业级项目或注重可扩展性、稳定性的项目则更适合商业框架。 从业者视角:开源…

    2025年12月18日
    000
  • C++框架大比拼:开源与商业谁更胜一筹?

    对于 c++++ 框架选择,开源与商业各有千秋:开源框架:免费、灵活,社区支持强,但缺乏技术支持和保证。商业框架:提供支持、文档齐全、版本稳定,但需要许可费,限制灵活性,社区支持有限。 C++ 框架大比拼:开源与商业,谁更胜一筹? C++ 广泛应用于打造高性能、高效的应用程序。选择合适的框架至关重要…

    2025年12月18日
    000
  • 开源还是商业?C++框架选用指南

    开源与商业 c++++ 框架优缺点对比:开源框架:免费使用,社区支持,可定制性强,但性能和商业支持有限。商业框架:性能稳定,专业支持,预置组件,但需付费,定制性受限,开源贡献受限。根据项目需求,选择开源框架适用于灵活性、成本优先的项目,而商业框架适用于高性能、稳定性、技术支持要求高的项目。 开源还是…

    2025年12月18日
    000
  • C++框架评估:开源与商业的全面解析

    摘要:开源c++++框架的优点包括免费、社区支持和灵活性,但缺乏支持和安全性问题。商业框架提供专业支持、性能和稳定性,但需要费用、受限的定制和供应商锁定。选择框架时,应考虑应用程序要求、预算、可定制性、社区支持等标准,根据项目需求做出明智的决策。 C++ 框架评估:开源与商业的全面解析 在选择 C+…

    2025年12月18日
    000
  • 特定领域C++框架的开源和商业解决方案比较

    特定领域c++++框架(dsf)旨在简化开发工作并提高应用程序质量。可用的dsf包含开源和商业解决方案。开源解决方案boost:广泛的c++库集合,涵盖字符串处理、网络编程等领域。opencv:计算机视觉和机器学习库,提供图像处理和物体检测算法。商业解决方案the qt framework:跨平台g…

    2025年12月18日
    000
  • C++ 框架的开源选项有哪些?

    c++++ 开发中的开源框架提供了众多优势,包括可重用代码、设计模式和最佳实践。本文重点介绍了五个流行的开源 c++ 框架:qt:用于创建跨平台 gui,提供丰富的组件、布局管理和信号/槽机制。boost:c++ 标准库的扩展,包含容器、算法、并发和字符串处理等功能。wxwidgets:跨平台 gu…

    2025年12月18日
    000
  • 怎么看php源码是不是开源_辨php源码是否开源方法

    要判断PHP源码是否开源,需检查根目录是否有LICENSE等文件并确认其为MIT、GPL等公认许可证;查看.php文件头部注释是否包含License关键词或链接;核实项目托管平台(如GitHub)页面是否标明许可证类型;使用FOSSA、Snyk等工具扫描代码库进行自动化检测;最后依据开源定义四大自由…

    2025年12月13日
    000
  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000

发表回复

登录后才能评论
关注微信