产业

多元推理刷新「人类的最后考试」记录，o3-mini(high)准确率最高飙升到37％

近期，deepseek r1推理模型在全球社交媒体引发热议，其类人的深度思考能力令人瞩目。然而，deepseek r1、openai o1和o3等模型在一些高难度基准测试中表现欠佳，例如国际数学奥林匹克竞赛（imo）组合问题、抽象推理语料库（arc）难题和人类的最后考试（hle）问题（论文链接）。例…

程序猿
2025年11月1日 • 用户投稿
0000
视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

重磅推荐：visual-rft——视觉强化微调开源项目，赋能视觉语言模型！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续关注全球顶尖AI研究，已发布2000余篇学术技术文章。欢迎投稿分享您的优秀成果！投稿邮箱：liyaz…

程序猿
2025年11月1日 • 用户投稿
0000