大模型
-
【原理解析】HAMi × NVIDIA | GPU 拓扑感知调度实现详解
hami 社区在 v2.7.0 版本中正式上线了面向 nvidia gpu 的 拓扑感知调度 功能。该功能旨在应对高性能计算(hpc)与 ai 大模型训练中的多卡通信瓶颈,通过智能任务调度机制,将计算负载精准部署到物理连接最优、通信延迟最低的 gpu 组合上,显著提升任务执行效率和集群整体算力利用率…
-
顶级阵容集结|李开复出席 GOTC 2025 主论坛,定义生成式 AI 下一站
GOTC 全球开源技术峰会(GOTC 2025)将于11月1日至2日在北京盛大启幕。届时,零一万物CEO、创新工场董事长李开复博士将重磅亮相GOTC 2025主论坛,并发表题为《生成式AI:从ChatBot到Agent的跃进与机会》的主题演讲。作为科技界与投资圈极具影响力的领军人物,他的出席无疑将为…
-
小模型训练效率狂飙 100 倍,Thinking Machine 推“在线策略蒸馏”
ai 新锐团队 thinking machine 近日推出一项革命性训练技术——在线策略蒸馏(on-policy distillation),成功将小规模模型在特定任务上的训练效率提升 50 至 100 倍,引发业界广泛关注。 长期以来,AI 模型训练始终困于两难境地:强化学习依赖试错探索,具备高度…
-
GOTC 2025 :探开源赋能,解 AI 人才痛点
当前,ai 技术正加速与各产业深度融合,深刻改变着各行各业的发展格局。在这一变革浪潮中,人才作为推动创新与可持续发展的核心动力,其培养与储备已成为决定产业升级成败的关键因素。 在此背景下,全球开源技术峰会 GOTC 2025 将重磅推出【AI 教育与人才培养】论坛,聚焦 AI 与开源教育的前沿趋势,…
-
蚂蚁发布千亿参数开源全模态大模型 Ming-flash-omni-Preview
蚂蚁百灵大模型团队近日正式推出了全新开源全模态大模型——ming-flash-omni-preview,标志着首个参数规模突破千亿的全模态模型正式向社区开放。该模型基于ling 2.0的稀疏moe架构构建,总参数量达103b,激活参数仅为9b,在保持高效推理的同时显著提升了多模态理解与生成能力。 相…
-
燧原科技丁圣阁出席 GOTC 2025,带来《面向业务场景落地的 AI 加速软件生态实践》干货分享
11 月 1 日,在即将举行的 2025 全球开源技术峰会(简称“gotc 2025”)的「大模型应用技术」专题论坛上,燧原科技软件工程师 丁圣阁 将发表主题为《面向业务场景落地的 ai 加速软件生态实践》的技术分享。 演讲议题:《面向业务场景落地的 AI 加速软件生态实践》 主要内容涵盖: 软件生…
-
临近一周年直降 2000 + 24 期免息:小米 15 手机 16+512GB 京东自营再降价
小米15系列震撼大促!搭载骁龙8至尊版旗舰芯,16gb+512gb版原价4999元,现在京东多重优惠叠加,到手价惊人,更享24期免息! 抄底神价!小米15如何做到史低价? 1、小米15(16GB+512GB版)在京东平台从4999元的官方定价,直降至4099元,这是优惠的第一步,直接省下近千元。 2…
-
为什么 MiniMax M2 是一个 Full Attention 模型?
来源:为什么MiniMax M2是一个Full Attention模型? 作为MiniMax M2预训练的负责人,我收到了很多来自社区的询问:“为什么你们在MiniMax M2上开倒车,采用了 Full Attention 机制?” 在一次又一次的聊天中解释了背后的故事后,我觉得是时候在一篇blog…
-
谷歌“最强芯片”Ironwood来袭,A股概念股已闻声大涨
谷歌近日宣布,即将全面推出其迄今为止最强大的自研芯片——ironwood。作为谷歌的第七代张量处理单元(tpu),ironwood最初于今年4月发布并进行测试,未来几周将正式全面上市。 谷歌方面介绍,新款的Ironwood TPU,其速度比上一代产品快了四倍多,并且可以在一个单一的计算集群(Pod)…
-
蚂蚁集团宣布组织架构升级,推动医疗健康业务成为战略支柱板块
11月7日,蚂蚁集团CEO韩歆毅发布全员信,宣布公司组织架构迎来重要调整:原“数字医疗健康事业部”正式升格为“健康事业群”,并明确将加速推进医疗健康业务发展,使之成为集团核心的战略支柱板块。 此次调整被视为蚂蚁近年来最为关键的一次架构变革。调整完成后,蚂蚁集团的业务版图更加清晰:在蚂蚁国际、蚂蚁数字…