deepseek_第131页

多元推理刷新「人类的最后考试」记录，o3-mini(high)准确率最高飙升到37％

近期，deepseek r1推理模型在全球社交媒体引发热议，其类人的深度思考能力令人瞩目。然而，deepseek r1、openai o1和o3等模型在一些高难度基准测试中表现欠佳，例如国际数学奥林匹克竞赛（imo）组合问题、抽象推理语料库（arc）难题和人类的最后考试（hle）问题（论文链接）。例…

程序猿

2025年11月1日 • 用户投稿

0000

用户投稿

545%！ DeepSeek首披露成本利润率专家：若在美国已是一家价值逾百亿美元公司

中国ai新创公司deepseek近来「开源」一波波，上周六 (1日) 又有更大惊喜，全面揭秘deepseek-v3/r1推理系统，不仅公开其推理系统的核心优化方案，更首次披露成本获利率等关键数据，引发产业震动。 DeepSeek上周六在知乎平台发布首条文章，公布模型推理成本利润细节，并披露成本获利率…

程序猿

2025年11月1日

0000

视觉强化微调！DeepSeek R1技术成功迁移到多模态领域，全面开源

重磅推荐：visual-rft——视觉强化微调开源项目，赋能视觉语言模型！ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏持续关注全球顶尖AI研究，已发布2000余篇学术技术文章。欢迎投稿分享您的优秀成果！投稿邮箱：liyaz…

程序猿

2025年11月1日 • 用户投稿

0000

上海AI Lab最新推出Mixture-of-Memories：线性注意力也有稀疏记忆了

aixiv专栏：探索mom：混合记忆模型，兼顾强大的记忆扩展能力和低序列复杂度 AIxiv专栏持续关注并报道全球顶尖AI学术研究和技术进展，至今已发布超过2000篇高质量文章。欢迎投稿或联系报道：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com 回…

程序猿

2025年11月1日 • 用户投稿

3000

用户投稿

告别空调噪音与闷热，TCL小蓝翼C7新风空调解决夏日清凉难题

夏日酷暑，空调本该是带来清凉的得力助手，却常常因各种问题让人烦不胜烦。噪音扰人、空气浑浊、电费高昂……这些传统空调的通病，正在被一款全新升级的新风空调彻底改变——tcl小蓝翼c7新风空调，以智慧科技重新定义舒适生活。传统空调三大难题：噪音、闷气、高耗电每当夜晚来临，对声音敏感的人总会被空调持续的…

程序猿

2025年10月31日

0000

用户投稿

数智融合为天津高质量发展注入新动能

7月31日，以“数智世界津门有为”为主题的“华为中国行2025·天津新质生产力城市峰会”在天津成功举办。在峰会期间的媒体沟通会上，华为天津政企业务总经理叶紫阳全面分享了华为在本地的技术落地成果与生态合作进展，深入阐述了如何通过数智化转型驱动区域新质生产力的高质量发展。多场景落地构建四大行业“天津范…

程序猿

2025年10月31日

0000

用户投稿

BabelDOC— 开源 AI PDF 翻译工具，专为科学论文翻译设计

babeldoc：开源智能pdf翻译工具，助力科研论文翻译 BabelDOC是一款开源的智能PDF翻译工具，专为科学论文翻译而设计。它能够在原文旁边直接生成翻译文本，实现便捷的双语对照阅读，无需在原文和译文之间切换窗口。更重要的是，BabelDOC能够完整保留原文中的数学公式、表格和图形，确保译文布…

程序猿

2025年10月31日

0000

用户投稿

DeepSeek-GRM— DeepSeek 联合清华推出的通用奖励模型

deepseek-grm：一个强大的通用奖励模型 DeepSeek-GRM是由DeepSeek团队和清华大学研究人员合作开发的通用奖励模型（Generalist Reward Modeling）。它采用点式生成式奖励建模（Pointwise Generative Reward Modeling, G…

程序猿

2025年10月31日

0000

用户投稿

DeepSeek联合清华大学发表论文旨在提高AI模型效率

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ DeepSeek携手清华大学，致力于降低人工智能(AI)模型训练成本，从而减少运营支出。 DeepSeek 一月份发布的低成本推理模型引发业界关注。该公司与北京大学研究人员合作，发表论文阐述了一…

程序猿

2025年10月31日

0000

用户投稿

DeepCoder-14B-Preview— Agentica 联合 Together AI 开源的代码生成模型

deepcoder-14b-preview：一款开源的140亿参数代码生成模型 Agentica和Together AI联合发布了DeepCoder-14B-Preview，这是一个基于Deepseek-R1-Distilled-Qwen-14B微调的大型代码生成模型。该模型采用分布式强化学习(RL…

程序猿

2025年10月31日

0000