产业
-
多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%



近期,deepseek r1推理模型在全球社交媒体引发热议,其类人的深度思考能力令人瞩目。然而,deepseek r1、openai o1和o3等模型在一些高难度基准测试中表现欠佳,例如国际数学奥林匹克竞赛(imo)组合问题、抽象推理语料库(arc)难题和人类的最后考试(hle)问题(论文链接)。例…
-
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源



重磅推荐:visual-rft——视觉强化微调开源项目,赋能视觉语言模型! ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续关注全球顶尖AI研究,已发布2000余篇学术技术文章。欢迎投稿分享您的优秀成果!投稿邮箱:liyaz…