阿联酋穆罕默德·本·扎耶德人工智能大学(mbzuai)在官网宣布,其与g42共同推出了一款低成本的推理模型“k2 think”。
新闻稿声称,K2 Think仅需320亿个参数,却能超越其他公司的、规模大20倍的推理模型。该模型基于阿里巴巴开源Qwen 2.5模型构建,并在Cerebras提供的硬件上运行和测试。

MBZUAI基础模型研究所所长Hector Liu告诉媒体,团队通过多种方法实现了高性能表现,包括:长链式思维监督微调(CoT) —— 一种逐步推理的方法;推理阶段扩展(test-time scaling) —— 在推理阶段分配更多计算资源来提升表现。
Liu表示:“特别之处在于,我们把它当作一个系统来对待,而不仅仅是一个模型。和普通的开源模型仅仅‘发布’不同,我们会实际部署该模型,并观察如何随着时间的推移改进模型。”“如果问哪一步最关键,很难单独指出。这更像是一整套方法的组合,才得出了最终结果。”
新闻稿写道,“K2 Think不仅仅是一项技术成就,更是阿联酋人工智能领域的一个决定性时刻。”
近年来,阿联酋也试图将自己定位为AI全球领导者,以提升地缘政治影响力,并减少对原油的依赖。阿联酋的AI企业G42就是其突围的例子。但其竞争对手包括邻国沙特,后者今年5月通过主权基金成立Humain,致力于打造全栈AI能力。
盘古大模型
华为云推出的一系列高性能人工智能大模型
35 查看详情
更宏观来看,阿联酋AI产业要追赶中美仍有很长路要走。美国的OpenAI和科技巨头已占据先机,中国也早已把AI列为战略重点。
尽管K2 Think的表现可与OpenAI相媲美,开发者强调,他们的目标并不是打造另一个ChatGPT。MBZUAI基础模型研究所总经理Richard Morton解释说,这个模型是为数学、科学等特定应用领域而设计。
他说:“人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要1000到2000人耗费五年时间才能完成的问题思考或临床实验,大大缩短周期。”
此外,它还能让缺乏美国那样资本与基础设施的地区,也能使用先进AI技术。Morton总结道:“我们正在发现,用更少的资源,其实可以做到更多。”
以上就是阿联酋推出低成本 AI 推理模型,宣称“性价比”超同行 20 倍的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/354786.html
微信扫一扫
支付宝扫一扫