开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单

能打得过gpt-4的开源模型出现了!

大模型竞技场最新战报:

1040亿参数开源模型Command R+攀升至第6位,与GPT-4-0314打成平手,超过了GPT-4-0613。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

这也是第一个在大模型竞技场上击败GPT-4的开放权重模型。

大模型竞技场,可是大神Karpathy口中唯二信任的测试基准之一。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

Command R+来自AI独角兽Cohere。这家大模型创业公司的联合创始人兼CEO,正是Transformer最年轻作者Aidan Gomez(简称割麦子)。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

这份战报一出,又掀起了一波大模型社区的热烈讨论。

大家伙儿兴奋的理由很简单:基础大模型卷了一整年,没想到在2024年格局还在不断地发展变化。

HuggingFace联合创始人Thomas Wolf就说:

最近大模型竞技场上的情况发生了巨大的变化:

Anthropic的Claude 3 opus在闭源模型中独占鳌头。

Cohere的Command R+则成为了开源模型中的最强者。

没想到,2024年在开源和闭源两条路线上,人工智能团队的发展都如此之快。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

另外,Cohere机器学习总监Nils Reimers还指出了值得关注的一点:

Command R+最大的特色是对内置RAG(检索增强生成)进行了全面优化,而在大模型竞技场中,RAG这样的外挂能力并未纳入测试。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

RAG优化模型登上开源王座

在Cohere官方定位中,Command R+是一个“RAG优化模型”。

就是说,这个1040亿参数的大模型主要针对检索增强生成技术进行了深度优化,以减少幻觉的产生,更适配于企业级工作负载。

和此前推出的Command R一样,Command R+的上下文窗口长度是128k。

此外,Command R+还具备以下特点:

WeShop唯象 WeShop唯象

WeShop唯象是国内首款AI商拍工具,专注电商产品图片的智能生成。

WeShop唯象 113 查看详情 WeShop唯象 覆盖10+种语言,包括英语、中文、法语、德语等;能使用工具完成复杂业务流程的自动化

从测试结果来看,在多语种、RAG和工具使用这三个维度上,Command R+都达到了GPT-4 turbo的水平。

但在输入成本方面,Command R+的价格仅为GPT-4 turbo的1/3。

输出成本方面,Command R+则是GPT-4 turbo的1/2。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

正是这点引发了不少网友的关注:

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

不过,尽管在大模型竞技场这种人类主观评测上表现抢眼,还是有网友甩出了一些不同观点。

在HumanEval上,Command R+的代码能力就连GPT-3.5都没打过,在两组测试中分别排在32位和33位。

最新版GPT-4 turbo则没有悬念地拿下了第一。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

另外,我们也在最近刚登上正经论文的弱智吧benchmark上简单测试了一下Command R+的中文能力。

开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单图片

你给打个分?

需要说明的是,Command R+的开源只面向学术研究,并不能免费商用。

One More Thing

最后的最后,还是多聊一嘴割麦子小哥。

Aidan Gomez,Transformer圆桌骑士中最年轻的一位,加入研究团队时只是个本科生——

不过,是在多伦多大学读大三时就加入了Hinton实验室的那种。

2018年,割麦子被牛津大学录取,开始像他的论文搭子们那样攻读CS博士学位。

但在2019年,随着Cohere的创立,他最终选择退学加入AI创业的浪潮。

Cohere主要是为企业提供大模型解决方案,目前估值达到了22亿美元。

参考链接:
[1]https://www.php.cn/link/3be14122a3c78d9070cae09a16adcbb1[2]https://www.php.cn/link/93fc5aed8c051ce4538e052cfe9f8692

以上就是开源模型首胜GPT-4!竞技场最新战报引热议,Karpathy:这是我唯二信任的榜单的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/616608.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月11日 04:19:30
下一篇 2025年11月11日 04:19:57

相关推荐

  • 了解AJAX所需的参数是什么?

    深入了解AJAX的参数:您需要掌握哪些参数? 引言: 在现代Web开发中,AJAX(Asynchronous JavaScript and XML)是一个被广泛使用的技术,它可以实现异步加载数据,从而提升用户体验。AJAX的核心是通过发送HTTP请求与服务器进行交互,并将响应的数据动态地展示在页面上…

    2025年12月24日
    000
  • 深入解析AJAX参数:它们的重要性何在?

    AJAX的参数详解:为什么它们如此重要? 随着Web应用的复杂性不断增加,用户对于实时响应和无刷新的交互体验的需求也越来越高。在这样的背景下,AJAX(Asynchronous JavaScript and XML)成为了前端开发中的必备技术。它可以实现异步数据交互,从服务器请求数据并将其无缝地展示…

    2025年12月24日
    000
  • 提升网页功能的关键:精通AJAX参数的运用

    学习AJAX参数的关键:掌握这些参数能让您的网页更强大,需要具体代码示例 随着互联网的发展,Ajax(Asynchronous JavaScript and XML)技术已经成为Web开发中不可或缺的一部分。它通过在不刷新整个页面的情况下与服务器进行异步通信,使网页更加流畅和响应快速。而要使用Aja…

    2025年12月24日
    000
  • 如何创建一个日期对象,它包括哪些参数?

    Date 对象是 JavaScript 语言中内置的数据类型。 Date 对象是使用新的 Date( ) 创建的,如下所示。 创建 Date 对象后,您可以使用多种方法对其进行操作。大多数方法仅允许您使用本地时间或 UTC(通用或 GMT)时间获取和设置对象的年、月、日、小时、分钟、秒和毫秒字段。 …

    2025年12月21日
    000
  • 如何在HTML中为对象添加参数?

    使用 标签为对象添加参数。 HTML 标签还支持以下附加属性 – 属性 值 说明 名称 立即学习“前端免费学习笔记(深入)”; 参数类型 定义参数的唯一名称。 类型 MIME 类型 指定参数的互联网媒体类型。 值 值 值 p> 指定参数的值。 值类型 数据 参考 对象 指定值的 M…

    2025年12月21日
    000
  • 详解html中页面跳转传递参数的问题

    效果如下图所示: a页面 点击跳转按钮后 立即学习“前端免费学习笔记(深入)”; 在b页面可以获取到对应的值。 推荐教程:html教程 代码如下: a页面: a页面 $(function(){ name = $(“#name”).text(); age = $(“#age”).text(); $(“…

    2025年12月21日
    000
  • iframe的各项参数

    这次给大家带来iframe的各项参数,iframe各项参数的注意事项有哪些,下面就是实战案例,一起来看一下。 iframe src=”test.jsp” width=”100″ height=”50″ frameborder=”no” border=”0″ marginwidth=”0″ margi…

    好文分享 2025年12月21日
    000
  • IE网页弹出窗口的参数都有哪些

    这次给大家带来ie网页弹出窗口的参数都有哪些,使用ie网页弹出窗口参数的注意事项有哪些,下面就是实战案例,一起来看一下。 弹出跟你当前的窗口有没有菜单工具栏没有关系,你只要在页面中写一个脚本它就弹出了.比如 xxxxx 以下列出一些弹出窗口的参数,你可自行设定,参数之间用逗号分隔 可选。字符串&#8…

    好文分享 2025年12月21日
    000
  • 关于html页面跳转传递参数问题解答

    本文主要介绍了html页面跳转传递参数问题的相关资料,需要的朋友可以参考下,希望能帮助到大家。 效果如下: a页面 点击跳转按钮后 在b页面可以获取到对应的值。 代码如下: 立即学习“前端免费学习笔记(深入)”; a页面:  a页面 $(function(){ name = $(“#name”).t…

    2025年12月21日
    000
  • 解决GPT-3.5 API生成无关代码的问题:优化模型选择与提示工程

    在使用GPT-3.5 API构建应用时,text-davinci-003模型有时会生成不相关或意外的代码片段,尤其是在处理代码或复杂对话任务时。本文旨在解决这一问题,核心在于强调模型选择的重要性,推荐使用更适合此类任务的指令遵循模型(如gpt-3.5-turbo或gpt-4),并深入探讨如何通过精细…

    2025年12月20日
    000
  • 人工智能工具市场

    AIprophetic.com 网站文章列表: 2025年: 2025-01-24: 人工智能工具市场概览 (https://www.php.cn/link/1c52486ff0b2a44fbfefeb15d21f53ae)2025-01-24: ChatGPT 故障排除及替代方案 (https:/…

    2025年12月19日
    000
  • 代码异味 – 非命令式函数名称

    清晰的函数命名:避免歧义,提升代码可读性 简而言之:含糊不清的函数名会隐藏其功能,令读者困惑。请使用具有描述性、面向动作的名称。 问题 函数用途不明确认知负担增加上下文误导可读性降低协作困难功能隐藏 解决方案 使用面向动作的动词使用描述性名称反映函数目的避免通用术语提供有意义的上下文明确表达单一职责…

    2025年12月19日 好文分享
    000
  • 克劳德·十四行诗 vs GPT-4o

    本案例研究对claude 3.5 sonnet和gpt-4o两种人工智能模型进行了深入比较,涵盖性能、定价和具体应用场景,并结合社区反馈、基准测试和实际使用经验。 Claude 3.5 Sonnet:智能且人性化 Claude 3.5 Sonnet是什么? Claude 3.5 Sonnet是Ant…

    2025年12月19日 好文分享
    000
  • 轨道:太阳系之旅

    去年十月,Masons团队参与了2024年NASA Space Apps Cairo黑客马拉松,并开发了一个令人振奋的项目——Orbit。Orbit是一个交互式3D网页应用,能够模拟太阳系并追踪近地天体(NEO)。它基于Next.js、Three.js和Golang后端构建,旨在提供宇宙的实时信息,…

    2025年12月19日
    000
  • 自写 Lang 图状态

    第一人工智能响应: 输出:感谢您伸出援手,.我很乐意为您提供帮助,但我想确保我完全理解您的需求。您能否提供有关您正在寻找的内容的更多详细信息?您分享的信息越多,我就越能提供帮助!我很乐意尽我所能地帮助你。您想进一步探索某个特定领域吗?您的意见将帮助我根据您的具体需求定制我的帮助。我完全致力于让您的体…

    2025年12月19日
    000
  • lambda演算的数学

    你认为人类发现了还是发明了计算? 我倾向于发现,因为图灵机和丘奇的 Lambda 微积分在 1936 年彼此独立地形式化,但两者也都具有普遍的表达能力(允许你计算一切)。非常不同,但 100% 等效。 我不是在谈论硬件计算机的发明,由于电子电路及其晶体管,它可以采取各种形式并普遍实现这些概念。我在这…

    2025年12月19日
    100
  • C++ 自身函数中参数的意义是什么?

    c++++ 内置函数参数意义:输入/输出流:cin(输入)、cout(输出)、cerr(错误信息)数学运算:abs(绝对值)、acos(反正余弦)、asin(反正弦)、atan2(反正切)、ceil(向上取整)、cos(余弦)、exp(自然指数)、floor(向下取整)、fmod(浮点余数)、log…

    2025年12月18日
    000
  • C++ 函数参数详解:避免参数过多带来的复杂性

    问题:如何避免函数参数过多带来的复杂性?答案:使用默认参数。将相关参数组合成结构。使用可变参数。重载函数。 C++ 函数参数详解:避免参数过多带来的复杂性 函数参数,作为将数据传递到函数的桥梁,对于函数的实际调用和使用至关重要。但在实际编程中,为函数定义过多的参数可能会导致代码变得臃肿不堪、晦涩难懂…

    2025年12月18日
    000
  • C++ 函数默认参数和可变参数在多线程环境中的使用策略

    在多线程环境中使用 c++++ 函数的默认参数和可变参数时,务必考虑线程安全问题。默认参数: 若默认参数不可变(如整型或字符串字面量),则线程安全,因为它们不会被修改。可变参数: 可将可变参数复制到线程本地存储中,每个线程拥有独立的副本,避免数据竞争。 C++ 函数的默认参数和可变参数在多线程环境中…

    2025年12月18日
    000
  • C++ 函数中引用参数和指针参数的高级用法

    c++++ 函数中的引用参数(本质为变量别名,修改引用修改原始变量)和指针参数(存储原始变量的内存地址,通过解引用指针修改变量)在传递和修改变量时有着不同的用法。引用参数常用于修改原始变量(尤其是大型结构体),传递给构造函数或赋值运算符时避免复制开销。指针参数则用于灵活指向内存位置,实现动态数据结构…

    2025年12月18日
    000

发表回复

登录后才能评论
关注微信