阿里云重磅发布!开源ai推理模型qwq-32b-preview惊艳亮相,推理能力媲美openai!
11月28日,阿里云通义团队正式开源了其全新AI推理模型QwQ-32B-Preview,并在多个平台开放体验。测试结果显示,该模型在数学、编程等领域展现出令人瞩目的研究生级推理能力,整体水平与OpenAI的o1模型不相上下。

QwQ(Qwen with Questions),作为通义千问Qwen大模型的实验性分支,是阿里云首个开源的AI推理模型。阿里云团队的研究表明,充分的思考、质疑和反思能够显著提升模型对数学和编程的理解。QwQ正是基于这一理念取得了突破性进展。
在多项权威评测中,QwQ表现出色:GPQA评测集(科学问题解决能力)准确率达65.2%;AIME评测(综合数学)胜率50%;MATH-500评测(数学解题能力)得分高达90.6%,超越o1-preview和o1-mini;LiveCodeBench评测(高难度代码生成)答对率达50%。
阿里云AI平台
阿里云AI平台
26 查看详情
QwQ的独特之处在于其深度自省能力。面对复杂问题,它能够质疑自身假设,进行深入的自我反思,并仔细检查每一步推理过程。例如,在“猜牌问题”中,QwQ通过分析对话和情境,展现了其缜密的思考能力,最终得出正确答案。
目前,QwQ-32B-Preview已在魔搭社区和HuggingFace平台开源,并迅速引发全球开发者的关注和热议。 虽然QwQ展现出强大的分析能力,但阿里云团队也指出,该模型仍处于实验阶段,存在一些局限性,例如语言混合使用、潜在偏见以及对专业领域知识的不足。团队表示,这些问题将在后续的研究和迭代中逐步解决。
访问链接:
Modelscope开源地址: https://www.php.cn/link/eec47207cb21f04c9ef47bcab8952517Modelscope创空间体验: https://www.php.cn/link/023b39a74b7b4acd060dedc0431c3dbcHuggingFace开源地址: https://www.php.cn/link/f775ec264c01adf8189da19ec86676feHuggingFace Space体验: https://www.php.cn/link/076d75c0dd9ca27b2f674c8f5433f50b
以上就是阿里云通义开源推理大模型QwQ,推理水平比肩OpenAI o1的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/565122.html
微信扫一扫
支付宝扫一扫