月之暗面
-
Kimi杀回来了!编程模型Kimi-Dev登顶开源榜一
还记得kimi吗?那个凭借超强长文本处理能力,能一口气“读完”数十万字小说而一炮走红的ai助手,曾是国产大模型中备受瞩目的明星。 然而,AI领域的竞争堪称“神仙打架”,技术迭代速度令人瞠目。在一波又一波新模型的冲击下,曾经风光无限的Kimi似乎略显沉寂,不少用户甚至直言它“掉队了”。 就在外界以为月…
-
开源赛道太挤了!月之暗面开源新版Muon优化器
月之暗面开源高效优化器muon,同等预算下性能翻倍! 月之暗面与DeepSeek再度“撞车”,这次是开源优化器Muon的较量。Muon优化器在计算效率上比AdamW提升了2倍,并已用于训练3B/16B参数的MoE模型Moonlight,刷新了当前的帕累托最优。 Muon的改进关键在于: 添加权重衰减…
-
AI搜索,正在成为新战场?
ai之后,企业们又盯上了ai搜索?近日,月之暗面推出的kimi探索版,使得发展多年的搜索领域再起硝烟。同时,多家企业的入局,也带来了一个疑问,ai搜索会取代传统搜索引擎吗? 1.搜索领域再起硝烟? AI搜索是什么?简单来说,就是基于人工智能技术的搜索引擎。与传统搜索引擎相比,搜索时间更快,搜索量也更…
-
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
月之暗面发布moba注意力机制,高效处理超长文本!近日,月之暗面团队公开了一种名为moba(mixture of block attention,块注意力混合)的全新注意力机制,该机制巧妙地将混合专家(moe)原理应用于注意力机制,并在长文本处理方面展现出显著优势。这与deepseek同期发布的ns…