模型_第12页

魔法原子发布端到端具身智能大模型，今年将量产 400 台人形机器人

魔法原子发布会：人形机器人、四足机器人及“原子万象”大模型惊艳亮相 3月26日，魔法原子举办“原子双生”2025场景战略发布会，重磅推出其人形机器人“小麦”和四足机器人，并首次发布端到端“原子万象大模型”。同时，公司启动“千景共创计划”，目标是与1000家合作伙伴合作，打造1000个基于人形机器人…

程序猿

2025年11月18日 • 用户投稿

2000

通义实验室新研究：大模型自己「扮演」搜索引擎，提升推理能力无需搜索 API

强化学习（rl）结合真实搜索引擎可以显著提升大模型的检索和推理能力。然而，这一方法面临两大挑战：搜索引擎返回的文档质量不稳定，导致训练过程中的噪音和不稳定性；rl 训练需要频繁部署，产生大量 api 开销，限制了可扩展性。针对这些问题，阿里通义实验室推出了开源解决方案 ZeroSearch，这是一…

程序猿

2025年11月17日 • 用户投稿

4000

全面评估多模态模型视频 OCR 能力，Gemini 准确率仅 73.7%

多模态大模型（mllm）在静态图像上已展现出强大的光学字符识别（ocr）能力，可以精准识别和理解图像中的文字内容。不过，当应用范围扩展到动态视频时，即使是当下最先进的模型也遇到了巨大的难题。 MME-VideoOCR 致力于全面评估并促进 MLLM 在视频 OCR 方面的感知、理解和推理能力。主…

程序猿

2025年11月17日 • 用户投稿

1000

用户投稿

华为推出准万亿参数盘古 Ultra MoE 模型全流程在昇腾 AI 平台训练

5 月 30 日，华为推出了全新的 AI 模型——盘古 Ultra MoE，该模型的参数量达到了 7180 亿。作为一款接近万亿参数的 MoE ( Mixture of Experts ) 模型，它在整个训练过程中完全基于华为的昇腾 AI 平台完成，标志着华为在超大规模模型训练方面取得了重要进展。 …

程序猿

2025年11月17日

0000

SOTA 大模型遇上加密数据评测：Qwen3 未破 10%，o1 也栽了

大语言模型面对加密数据，即便最新的qwen3也会感到压力！尽管当下各类推理模型在多种基准测试中表现优异，但在密码学这样对逻辑严谨性和细节准确性要求极高的专业领域，模型的推理能力还有待深入挖掘。密码学不仅要求模型具备高级数学运算能力和严密的逻辑推理链，还需要其能够精准辨识复杂加密模式中的潜在规律；…

程序猿

2025年11月17日 • 用户投稿

0000

用户投稿

华为人工智能领域新专利公布可降低扩散模型训练成本

cnmo 获悉，7 月 18 日，华为技术有限公司申请的 ” 一种模型训练方法、数据生成方法及相关设备 ” 专利公布。该专利类型为发明公布，申请日是 2024 年 1 月 16 日，法律状态为审中。华为集团根据专利摘要显示，本申请涉及人工智能领域。该方法中，获取多个第一训…

程序猿

2025年11月15日

10000

告别“炼丹玄学”：上海 AI 实验室推出首个大模型数据竞技场 OpenDataArena

数据在 ai 时代的重要性已经不言而喻，但悬而未决的是—— 如何精确量化这些数据的价值、辨别其优劣？为此，上海人工智能实验室 OpenDataLab 团队在数据领域持续深耕，正式推出了开放数据竞技场 OpenDataArena。展开来说，在海量的 SFT（监督式微调）后训练数据面前，研究者们常常…

程序猿

2025年11月14日 • 用户投稿

0000

RLHF 2%的算力应用于消除LLM有害输出，字节发布遗忘学习技术

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免 LLM 产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少 LLM 幻觉（hallucinations，即错误事实）? 如何在数据政策更改后快速迭代 LLM？这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下，对于 LL…

程序猿

2025年11月11日 • 用户投稿

1000