AI 的下一个战场:小模型崛起

ai 的下一个战场:小模型崛起

过去一段时间,大模型行业经历了一场风切变。

八月初,腾讯官宣 ” 混元系列小模型 ” 落地,不久后,阿里跟进了两款通义 Qwen3-4B。

起初,大家以为只是国内大厂对轰,互秀肌肉罢了。

几天后,剧情愈演愈烈,大洋彼岸的 OpenAI 也加入战斗,破天荒开源 gpt-oss-20B 等两款模型,同样聚焦在小模型上。

头部玩家们如此整齐划一的举动,很难让人不浮想翩翩:

在大集群训练、大集群部署之外,小模型要重回舞台中央。

小模型重回大众视野

小模型不是一个新名词。

但这次回归的,不是停留在论文上的小模型,而是真正落地在终端的小模型。

在 2020 年 GPT-3 发布之前,全世界都在训小模型,只不过大多数小模型成果,都在论文里或者实验室里,属于普罗大众眼里纸上谈兵的 ” 小模型 “。

但 GPT-3 连带着 ChatGPT 横空出世,从学术界出圈,成为了人工智能领域史诗级的商业化产品。

有了资本加持,人工智能的发展从「大炼模型」迈入了「炼大模型」时代。

2021 年到 2024 年,AI 的技术路线可以总结成五个字:大力出奇迹 “。

堆数据,堆算力,打补丁,改 prompt,以及做 post training 的大模型思路,成了人工智能的正统,小模型至此彻底被雪藏了。

但去年底,OpenAI 的前首席科学家 Ilya Sutskever 正式预警:「数据压榨到头了」。

大家逐渐意识到,数据会枯竭,算力永远不够。

于是今年开始,大模型领域玩家开始分化。

除了一部分头部玩家仍追随 OpenAI 的脚步,死磕大参数基模外,剩下很多烧不起钱的玩家开始转头拥抱应用端。

然而,在这两个主流之外,还有一小撮 ” 非共识 ” 的玩家,把目光落在了小模型上。

但这次,不少创业公司重新拾起的小模型,和文章开头提到 ChatGPT 出现前十年间停留在论文上的小模型完全不一样。

它们是真正落地在终端的小模型,并且有了另一个名字:

端侧小模型或端侧智能。

崭露头角的端侧小模型公司们

今年以来,不少端侧小模型已经开始崭露头角了。

前一段的 WAIC 上,西门子 MindSphere 展台上围满了专业观众。

大家正在看一个展台上一个小于 50MB 的端侧部署小模型,它能够预测现场的三台冲压设备故障,并发出警报。

在这之前,车间里冲压机床只有累到趴窝才会被工人察觉,紧接着就需要停摆检修,造成全车间流水线暂停,带来巨大人力和财力损失。

因此在冲压机床出故障前,预警功能就非常重要。

面对这样的小场景,大模型算力再强,moe 结构设计再精妙,也无法处理。

但这样一个精准的端侧小模型,就能够轻松应对。

这就是落地在终端小模型的冰山一角。

在这条窄路上前进的,还有一些独角兽公司,比如 base 北京的 AI 初创公司面壁智能。

之所以关注这家企业,是因为这家公司今年五月的一次成功融资

在 DeepSeek 大火后,国内大模型公司融资难度堪比抵地狱级。一方面是行业共识认为大模型已收敛,另一方面,有 DeepSeek 珠玉在前,你实在太难说服投资人为什么要投你了。

但面壁智能却能持续拿到融资。

我问了很多业内人士,得到一个答案,关键在于它早早找到了自己的道路:小模型。

AI 科技评论独家知悉,就在这几天,面壁的全体员工,收到了一封特殊的 ” 内部信 “。

邮件来自公司决策层,借着公司三周年周庆,高层向全体员工回答了一个问题:为什么公司从大模型切入,却 all in 端侧小模型?

邮件讲述了一些底层思考,内容非常爆炸,即使是外人看来,也能从一家 AI 初创公司的生存视角,有所收获。

按照邮件内的时间节点描述,面壁智能的创立初期是 100% 坚定大模型方向的。

它的创立时间是 2022 年,甚至早于 DeepSeek。

创始团队出身于清华系,来自清华大学自然语言处理实验室。

在创立之前,面壁的创始团队就主力参与北京智源人工智能研究院的 ” 悟道 “,从时间来看,面壁智能应该吃到一波融资的红利,但我们先去分析过,国内的 AI 科技 VC 有一些路径依赖,更愿意选择一些 ” 曾经打过胜仗的连续创业者 “,导致面壁智能虽然起的大早,但并没有成为资本的宠儿,而是靠自己硬拚出来的天地。

2022-2023 年间,面壁一直在死磕大模型,当初他们的愿景是做出平民版大模型,我们曾经写过稿件,认为他是国内和 DeepSeek 愿景最类似的公司。

当然,面壁也做出了不少成绩,比如训练出多个百亿、千亿参数规模的大模型。

转折点发生在 2023 年。

2023 年,随着 Llama 开源,众多资本涌入,那一年里,大模型的创业公司增加到了十几家。

面壁智能迅速发现,千亿大模型烧钱太快,并且商业化方面难以落地,于是果断选择了调整战略,决定转向训练参数规模更小、算力更低、但性能更强的端侧模型。

转型之初,面壁并不容易。

一方面,端侧智能算是在黑暗中摸索,另一方面,市场上噪音很多,比如 DeepSeek V3 以少胜多的战役,也曾让面壁的创始人怀疑,如果坚持不转型,是否自己也有机会在大模型上攀上一座高峰。(后续的行情,证明面壁智能果断转型是明智的)

但彼时,面壁已经全盘 all in 端侧小模型,已经失去验证 ” 更低成本训练更强大模型 ” 的机会了。

好在小模型并不是邪修,面壁团队迅速在端侧小模型赛道找到感觉,有了一些自己的思路。

03 想成为端侧小模型的 ” 开拓者 “,并不容易

从时间上看,面壁智能不仅比文章开头提到的 ” 混元 ” 和 ” 通义 Qwen3″ 更早开启小模型的探索,并且在端侧探索上,几乎是领先行业一年半的身位。

提前一年半的布局,让面壁有不少成果。

第一是模型层面,面壁的端侧模型被称为小钢炮 MiniCPM 系列。

至今已经完成多次迭代,最新的是上周开源的 minicpm v4.0 ,一款 8B 能做到 5% 的极高稀疏度,端侧能跑长文本、深思考,另一款 0.5B 更是能适配非常多的终端场景,能做到手机端持续、稳定可用,还不发热。

再加上此前做在视觉及实时语音对话等优化,面壁智能的端侧模型,完全能实现在 iPad 上进行多模态直播,这意味着,它的使用场景变得异常丰富。

从麦当劳的点餐机器人,到政府行政服务中心的服务机器人,再到儿童陪伴玩具都能完全能够胜任。

除了技术层面的突破,还有一些学术和开源成果。

上个月《Nature Communications》正式收录了面壁智能此前发布的一项关于新模型 MiniCPM-V 的研究成果系列。

其中包括一个 OpenCompass 评分中超越 GPT-4V(2023.11.16 版本)的 80 亿参数模型。

开源方面,面壁智能的小钢炮 MiniCPM 系列是 2024 年 Hugging Face 最多下载、最受欢迎中国大模型,截至目前全平台下载量累计破 1000 万,能看到一定的使命感在里面。

除去技术层面和学术等层面,但真正能让大家直观感受的,还是落地到现实世界的场景。

社交媒体上经常有一些同类型的问题,为什么都说大模型能力早早超越人类,但迟迟没看到惊艳的落地场景?

答案在于大模型的能力,需要高性能云服务器才能发挥出来。

但大家平时生活中使用的手机,平板汽车等设备,都是算力非常有限的设备。

这类型设备有一个学名,叫做 ” 边端算力场景 “。

而这正是众多小模型厂家的主场。

继续拿面壁智能举例。和需要调用各种云端超高算力的大模型不一样,面壁的小钢炮系列模型,能在消费级显卡上流畅运行。

这就意味着手机,个人电脑,汽车,机器人,甚至是刚才提到的工厂环境,以及一些涉密的政府部门等等都可以部署。

” 不仅把模型的配置门槛打下来了,使用场景还变得更丰富了 “。

在面壁智能的内部信上,也提到了这些场景。

首先是汽车场景,面壁智能围绕着智能座舱,发布了一个以 MiniCPM 模型为核心汽车助手 cpmGO 。

我查了一下,这是业界第一个纯端侧的智能座舱。(雷峰网)

目前 cpmGO ,已经与长安、上汽大众、长城、吉利、广汽等车企谈完合作了。

不出意外,第一款量产车会落在今年三季度即将上市的网红车款长安马自达 MAZDA EZ-60 上。

不止是车企,面壁还与高通、英特尔、联发科技、梧桐车联、德赛西威、中科创达、安波福等做了深度适配,正在推动下一代智能座舱的诞生。

这一点,面壁高层非常重视,根据内部信的内容,面壁今年为此特地成立了汽车业务线,目标非常简单粗暴:

” 将 MiniCPM 搭载到更多汽车上 “。

从某种意义上,面壁确实在端侧的技术探索和实践落地上,在努力成为行业开拓者的角色。

最后,当我们在写这篇文章的时候得知,前面提到那个西门子展台的冲压机床预警小模型,经过几个月的真实产线的数据训练,预测准确率已经提升到 89%,随着时间积累,准确度还在不断提高中。

与此同时,面壁智能的全体员工,也在对这份内部信进行了深度复盘。

过去,大模型领域在资本的加持下,蒙眼狂奔,让我们误以为 AGI 很快会到来,不做大模型就是原罪。

但当头部大模型企业开始进入瓶颈期,我们也冷静下来才逐渐看到,有那么多端侧小模型企业,正在脚踏实地去思考人类到底喜欢什么,大众到底需要什么,然后反推出背后的技术路线,做出小而美的落地产品。

它们值得被看到。(雷峰网)

以上就是AI 的下一个战场:小模型崛起的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/75242.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月14日 08:23:30
下一篇 2025年11月14日 10:19:57

相关推荐

  • Uniapp 中如何不拉伸不裁剪地展示图片?

    灵活展示图片:如何不拉伸不裁剪 在界面设计中,常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。 对于不同尺寸的图片,可以采用以下处理方式: 极端宽高比:撑满屏幕宽度或高度,再等比缩放居中。非极端宽高比:居中显示,若能撑满则撑满。 然而,如果需要不拉伸不…

    2025年12月24日
    400
  • 如何让小说网站控制台显示乱码,同时网页内容正常显示?

    如何在不影响用户界面的情况下实现控制台乱码? 当在小说网站上下载小说时,大家可能会遇到一个问题:网站上的文本在网页内正常显示,但是在控制台中却是乱码。如何实现此类操作,从而在不影响用户界面(UI)的情况下保持控制台乱码呢? 答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体,并通过在客户端…

    2025年12月24日
    800
  • 如何在地图上轻松创建气泡信息框?

    地图上气泡信息框的巧妙生成 地图上气泡信息框是一种常用的交互功能,它简便易用,能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。 利用地图库的原生功能 大多数地图库,如高德地图,都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现: 高德地图 JS API 参考文…

    2025年12月24日
    400
  • 如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画?

    如何实现元素scrollleft变化时的平滑动画效果? 在许多网页应用中,滚动容器的水平滚动条(scrollleft)需要频繁使用。为了让滚动动作更加自然,你希望给scrollleft的变化添加动画效果。 解决方案:scroll-behavior 属性 要实现scrollleft变化时的平滑动画效果…

    2025年12月24日
    000
  • 如何为滚动元素添加平滑过渡,使滚动条滑动时更自然流畅?

    给滚动元素平滑过渡 如何在滚动条属性(scrollleft)发生改变时为元素添加平滑的过渡效果? 解决方案:scroll-behavior 属性 为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码: click the button to slide right!…

    2025年12月24日
    500
  • 如何选择元素个数不固定的指定类名子元素?

    灵活选择元素个数不固定的指定类名子元素 在网页布局中,有时需要选择特定类名的子元素,但这些元素的数量并不固定。例如,下面这段 html 代码中,activebar 和 item 元素的数量均不固定: *n *n 如果需要选择第一个 item元素,可以使用 css 选择器 :nth-child()。该…

    2025年12月24日
    200
  • 使用 SVG 如何实现自定义宽度、间距和半径的虚线边框?

    使用 svg 实现自定义虚线边框 如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片,但是这种方法存在引入外部资源、性能低下的缺点。 为了避免上述问题,可以使用 svg(可缩放矢量图形)来创建纯代码实现。一种方…

    2025年12月24日
    100
  • 如何让“元素跟随文本高度,而不是撑高父容器?

    如何让 元素跟随文本高度,而不是撑高父容器 在页面布局中,经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中,父容器被较高的图片撑开,而文本的高度没有被考虑。本问答将提供纯css解决方案,让图片跟随文本高度,确保父容器的高度不会被图片影响。 解决方法 为了解决这个问题,需要将图片从文档流中脱离…

    2025年12月24日
    000
  • 为什么 CSS mask 属性未请求指定图片?

    解决 css mask 属性未请求图片的问题 在使用 css mask 属性时,指定了图片地址,但网络面板显示未请求获取该图片,这可能是由于浏览器兼容性问题造成的。 问题 如下代码所示: 立即学习“前端免费学习笔记(深入)”; icon [data-icon=”cloud”] { –icon-cl…

    2025年12月24日
    200
  • 如何利用 CSS 选中激活标签并影响相邻元素的样式?

    如何利用 css 选中激活标签并影响相邻元素? 为了实现激活标签影响相邻元素的样式需求,可以通过 :has 选择器来实现。以下是如何具体操作: 对于激活标签相邻后的元素,可以在 css 中使用以下代码进行设置: li:has(+li.active) { border-radius: 0 0 10px…

    2025年12月24日
    100
  • 如何模拟Windows 10 设置界面中的鼠标悬浮放大效果?

    win10设置界面的鼠标移动显示周边的样式(探照灯效果)的实现方式 在windows设置界面的鼠标悬浮效果中,光标周围会显示一个放大区域。在前端开发中,可以通过多种方式实现类似的效果。 使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

    2025年12月24日
    200
  • 为什么我的 Safari 自定义样式表在百度页面上失效了?

    为什么在 Safari 中自定义样式表未能正常工作? 在 Safari 的偏好设置中设置自定义样式表后,您对其进行测试却发现效果不同。在您自己的网页中,样式有效,而在百度页面中却失效。 造成这种情况的原因是,第一个访问的项目使用了文件协议,可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

    2025年12月24日
    000
  • 如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果?

    如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果 想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果,可以通过以下途径: CSS 解决方案 DEMO 1: Windows 10 网格悬停效果:https://codepen.io/tr4553r7/pe…

    2025年12月24日
    000
  • 使用CSS mask属性指定图片URL时,为什么浏览器无法加载图片?

    css mask属性未能加载图片的解决方法 使用css mask属性指定图片url时,如示例中所示: mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是,在网络面板中却…

    2025年12月24日
    000
  • 如何用CSS Paint API为网页元素添加时尚的斑马线边框?

    为元素添加时尚的斑马线边框 在网页设计中,有时我们需要添加时尚的边框来提升元素的视觉效果。其中,斑马线边框是一种既醒目又别致的设计元素。 实现斜向斑马线边框 要实现斜向斑马线间隔圆环,我们可以使用css paint api。该api提供了强大的功能,可以让我们在元素上绘制复杂的图形。 立即学习“前端…

    2025年12月24日
    000
  • 图片如何不撑高父容器?

    如何让图片不撑高父容器? 当父容器包含不同高度的子元素时,父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开,避免图片对其产生影响,可以通过以下 css 解决方法: 绝对定位元素: .child-image { position: absolute; top: 0; left: …

    2025年12月24日
    000
  • CSS 帮助

    我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

    2025年12月24日 好文分享
    200
  • 前端代码辅助工具:如何选择最可靠的AI工具?

    前端代码辅助工具:可靠性探讨 对于前端工程师来说,在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而,并非所有工具都能提供同等的可靠性。 个性化需求 关于哪个AI工具最可靠,这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素: 立…

    2025年12月24日
    000
  • 如何用 CSS Paint API 实现倾斜的斑马线间隔圆环?

    实现斑马线边框样式:探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。 问题: 给定一个有多个圆圈组成的斑马线图案,如何使用 css 实现倾斜的斑马线间隔圆环? 答案: 立即学习“前端免费学习笔记(深入)”; 使用 css paint api…

    2025年12月24日
    000
  • 如何使用CSS Paint API实现倾斜斑马线间隔圆环边框?

    css实现斑马线边框样式 想定制一个带有倾斜斑马线间隔圆环的边框?现在使用css paint api,定制任何样式都轻而易举。 css paint api 这是一个新的css特性,允许开发人员创建自定义形状和图案,其中包括斑马线样式。 立即学习“前端免费学习笔记(深入)”; 实现倾斜斑马线间隔圆环 …

    2025年12月24日
    100

发表回复

登录后才能评论
关注微信