模型
-
魔法原子发布端到端具身智能大模型,今年将量产 400 台人形机器人
魔法原子发布会:人形机器人、四足机器人及“原子万象”大模型惊艳亮相 3月26日,魔法原子举办“原子双生”2025场景战略发布会,重磅推出其人形机器人“小麦”和四足机器人,并首次发布端到端“原子万象大模型”。 同时,公司启动“千景共创计划”,目标是与1000家合作伙伴合作,打造1000个基于人形机器人…
-
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索 API
强化学习(rl)结合真实搜索引擎可以显著提升大模型的检索和推理能力。然而,这一方法面临两大挑战:搜索引擎返回的文档质量不稳定,导致训练过程中的噪音和不稳定性;rl 训练需要频繁部署,产生大量 api 开销,限制了可扩展性。 针对这些问题,阿里通义实验室推出了开源解决方案 ZeroSearch,这是一…
-
全面评估多模态模型视频 OCR 能力,Gemini 准确率仅 73.7%
多模态大模型(mllm)在静态图像上已展现出强大的光学字符识别(ocr)能力,可以精准识别和理解图像中的文字内容。 不过,当应用范围扩展到动态视频时,即使是当下最先进的模型也遇到了巨大的难题。 MME-VideoOCR 致力于全面评估并促进 MLLM 在视频 OCR 方面的感知、理解和推理能力。 主…
-
华为推出准万亿参数盘古 Ultra MoE 模型 全流程在昇腾 AI 平台训练
5 月 30 日,华为推出了全新的 AI 模型——盘古 Ultra MoE,该模型的参数量达到了 7180 亿。作为一款接近万亿参数的 MoE ( Mixture of Experts ) 模型,它在整个训练过程中完全基于华为的昇腾 AI 平台完成,标志着华为在超大规模模型训练方面取得了重要进展。 …
-
SOTA 大模型遇上加密数据评测:Qwen3 未破 10%,o1 也栽了
大语言模型面对加密数据,即便最新的qwen3也会感到压力! 尽管当下各类推理模型在多种基准测试中表现优异,但在密码学这样对逻辑严谨性和细节准确性要求极高的专业领域,模型的推理能力还有待深入挖掘。 密码学不仅要求模型具备高级数学运算能力和严密的逻辑推理链,还需要其能够精准辨识复杂加密模式中的潜在规律;…
-
华为人工智能领域新专利公布 可降低扩散模型训练成本
cnmo 获悉,7 月 18 日,华为技术有限公司申请的 ” 一种模型训练方法、数据生成方法及相关设备 ” 专利公布。该专利类型为发明公布,申请日是 2024 年 1 月 16 日,法律状态为审中。 华为集团 根据专利摘要显示,本申请涉及人工智能领域。该方法中,获取多个第一训…
-
告别“炼丹玄学”:上海 AI 实验室推出首个大模型数据竞技场 OpenDataArena
数据在 ai 时代的重要性已经不言而喻,但悬而未决的是—— 如何精确量化这些数据的价值、辨别其优劣? 为此,上海人工智能实验室 OpenDataLab 团队在数据领域持续深耕,正式推出了开放数据竞技场 OpenDataArena。 展开来说,在海量的 SFT(监督式微调)后训练数据面前,研究者们常常…
-
RLHF 2%的算力应用于消除LLM有害输出,字节发布遗忘学习技术
随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hallucinations,即错误事实)? 如何在数据政策更改后快速迭代 LLM?这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下,对于 LL…
-
纸质二维码也能隔空篡改:百米之外无痕攻击,秒变恶意网站入口
现在,打印好的纸质二维码,可能也不安全了! 通过激光照射,攻击者在一百米开外就能分分钟实施篡改。 更可怕的是,这种激光用肉眼根本无法察觉,正常的二维码在无意之间就有可能变成恶意网站的入口。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 最近…
-
何恺明与MIT合作:简单框架实现无条件图像生成的最新突破
大佬何恺明还未正式入职mit,但和mit的第一篇合作研究已经出来了: 他和MIT师生一起开发了一个自条件图像生成框架,名叫RCG(代码已开源)。 这个框架结构非常简单但效果拔群,直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索…