考试
-
如果让 AI 来写高考作文,能得多少分?
大家好,我是树义。 不知不觉,这两天又是高考的时候。距离我高考已经过去了整整 12 个年头了,想想那时候智能手机也不怎么普及,不像现在那样人手一个智能机。 现在不仅信息技术发达,人工智能技术也是突飞猛进。于是我突发奇想:如果让 AI 也来做一回考生,写一次高考作文,那它能得多少分呢? 考生请就位 考…
-
DeepSeek-R1 超级外挂!“人类最后的考试”首次突破 30 分,上海交大等开源方案碾压 OpenAI、谷歌
” 人类最后的考试 ” 首次突破 30 分,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过 10 分。 直到最近,最高分也不过 26.9,由 Kimi-Research 和 Gemini Deep Research 并列取得。 现在,上海交大联合深势科…
-
首个开源多模态 Deep Research 智能体,超越多个闭源方案
研究团队 投稿 量子位 | 公众号 QbitAI 首个开源多模态 Deep Research Agent 来了。 整合了网页浏览、图像搜索、代码解释器、内部 OCR 等多种工具,通过全自动流程生成高质量推理轨迹,并用冷启动微调和强化学习优化决策,使模型在任务中能自主选择合适的工具组合和推理路径。 假…