count(*)为什么很慢？原因分析

程序猿 • 2025年11月5日 22:34:55 • 用户投稿 • 阅读 1

count(*)为什么很慢？下面本篇文章就来给大家分析一下原因，并聊聊count(*)的执行过程，希望对大家有所帮助！

本没想着写这篇文章的，因为我觉得这个东西大多数有经验的开发遇到过，肯定也了解过相关的原因，但最近我看到有几个关注的技术公众号在推送相关的文章。实在令我吃惊！

先上公众号文章的结论：

count(*) ：它会获取所有行的数据，不做任何处理，行数加1。count(1)：它会获取所有行的数据，每行固定值1，也是行数加1。count(id)：id代表主键，它需要从所有行的数据中解析出id字段，其中id肯定都不为NULL，行数加1。count(普通索引列)：它需要从所有行的数据中解析出普通索引列，然后判断是否为NULL，如果不是NULL，则行数+1。count(未加索引列)：它会全表扫描获取所有数据，解析中未加索引列，然后判断是否为NULL，如果不是NULL，则行数+1。

结论：count(*) ≈ count(1) > count(id) > count(普通索引列) > count(未加索引列)

我也不想卖关子了，以上结论纯属放屁。根本就是个人yy出来的东西，甚至不愿意去验证一下，哪怕看一眼执行计划，也得不出这么离谱的结论。

我不敢相信这是一篇被多个技术公众号转载的文章！

以下所有的内容均是基于，mysql 5.7 + InnoDB引擎，进行的分析。

拓展：

MyISAM 如果没有查询条件，只是简单的统计表中数据总数，将会返回的超快，因为service层中获取到表信息中的总行数是准确的，而InnoDB只是一个估值。

实例

废话不多说，先看一个例子。

以下是一张表数据量有100w，表中字段相对较短，整体数据量不算大。

CREATE TABLE `hospital_statistics_data` (  `pk_id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',  `id` varchar(36) COLLATE utf8mb4_general_ci NOT NULL COMMENT '外键',  `hospital_code` varchar(36) COLLATE utf8mb4_general_ci NOT NULL COMMENT '医院编码',  `biz_type` tinyint NOT NULL COMMENT '1服务流程  2管理效果',  `item_code` varchar(36) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '考核项目编码',  `item_name` varchar(64) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '考核项目名称',  `item_value` varchar(36) COLLATE utf8mb4_general_ci DEFAULT NULL COMMENT '考核结果',  `is_deleted` tinyint DEFAULT NULL COMMENT '是否删除 0否 1是',  `gmt_created` datetime DEFAULT NULL COMMENT '创建时间',  `gmt_modified` datetime DEFAULT NULL COMMENT 'gmt_modified',  `gmt_deleted` datetime(3) DEFAULT '9999-12-31 23:59:59.000' COMMENT '删除时间',  PRIMARY KEY (`pk_id`)) DEFAULT CHARSET=utf8mb4  COMMENT='医院统计数据';

此表初始状态只有一个聚簇索引。

以下分不同索引情况，看一下COUNT(*)的执行计划。

1）在只有一个聚簇索引的情况下看一下执行计划。

EXPLAIN select COUNT(*) from hospital_statistics_data;

结果：

关于执行计划的各个参数的含义，不在本文的讨论范围内，可自行了解。

这里只关注以下几个属性。

type: 这里显示index，说明使用了索引。

key：PRIMARY使用了主键索引。

key_len: 索引长度8字节。

这里有很关键的一点：count(*)也会走索引，在当前情况下使用了聚簇索引。

好，再往下看。

2）存在一个非聚簇索引（二级索引）

给表添加一个hospital_code索引。

alter table hospital_statistics_data add index idx_hospital_code(hospital_code)

此时表中存在2个索引，主键 和 hospital_code。

同样的，再执行一下：

EXPLAIN select COUNT(*) from hospital_statistics_data;

结果：

同样的，看一下 type、key和key_len三个字段。

是不是觉得有点“神奇”。

为何索引变成刚添加的idx_hospital_code了。

先别急着想结论，再看下面一种情况。

3）存在两个非聚簇索引（二级索引）

在上面的基础上，再添加一个二级索引。

alter table hospital_statistics_data add index idx_biz_type(biz_type)

此时表中存在3个索引，主键、hospital_code 和 biz_type。

同样的，执行一下：

EXPLAIN select COUNT(*) from hospital_statistics_data;

结果：

是不是更困惑了，索引又..又又…变了.

变成新添加的idx_biz_type。

先不说为何会产生以上的变化，继续往下分析。

在以上3个索引的基础上，分别看一下，count(1)、count(id)、count(index)、count(无索引)

这4种情况，与count(*)的执行计划有何区别。

count(1)

count(id)对于样例表来说是,主键是pk_id

count(index)

这里选取biz_type索引字段。

因赛AIGC

因赛AIGC解决营销全链路应用场景

73 查看详情

count(无索引)

小结：

count(index) 会使用当前index指定的索引。

count(无索引) 是全表扫描，未走索引。

count(1) , count(*), count(id) 一样都会选择idx_biz_type索引

看到这，你还觉得那些千篇一律的公众号文章的结论正确吗？

必要知识点

mysql 分为service层和引擎层。

所有的sql在执行前会经过service层的优化，优化分为很多类型，简单的来说可分为成本和规则。

执行计划所反映的是service层经过sql优化后，可能的执行过程。并非绝对（免得有些人说我只看执行计划过于片面）。绝大多数情况执行计划是可信的。

索引类型分为聚簇索引和非聚簇索引（二级索引）。其中数据都是挂在聚簇索引上的，非聚簇索引上只是记录的主键id。

抛开数据内存，只谈数据量，都是扯淡。什么500w就是极限，什么2个表以上的join都需要优化了，什么is null不会走索引等，纯纯的放屁。

相信一点，编写mysql代码的人比，看此文章的大部分人都要优秀。他们会尽可能在执行前，对我这样菜逼写的乱七八糟的sql进行优化。

原因分析

其实原因非常非常简单，上面也说了，service层会基于成本进行优化。

并且，正常情况下，非聚簇索引所占有的内存要远远小于聚簇索引。所以问题来了，如果你是mysql的开发人员，你在执行count(*)查询的时候会使用那个索引？

我相信正常人都会使用非聚簇索引。

那如果存在2个甚至多个非聚簇索引又该如何选择呢？

那肯定选择最短的，占用内存最小的一个呀，在回头看看上面的实例，还迷惑吗。

同样都是非聚簇索引。idx_hospital_code的len是146字节；而idx_biz_type的len只有1。那还要选吗？

那为何count(*)走了索引，却还是很慢呢？

这里要明确一点，索引只是提升效率的一种方式，但不能完全的解决效率问题。count(*)有一个明显的缺陷，就是它要计算总数，那就意味着要遍历所有符合条件的数据，相当于一个计数器，在数据量足够大的情况下，即使使用非聚簇索引也无法优化太多。

官方文档：

InnoDBhandlesSELECT COUNT(*)andSELECT COUNT(1)operations in the same way. There is no performance difference.

简单的来说就是，InnoDB下 count(*) 等价于 count(1)

既然会自动走索引，那么上面那个所谓的速度排序还觉得对吗？ count(*)的性能跟数据量有很大的关系，此外最好有一个字段长度较短的二级索引。

拓展：

另外，多说一下，关于网上说的那些索引失效的情况，大多都是片面的，我这里只说一点。量变才能引起质变，索引的失效取决于你圈定数据的范围，若你圈定的数据量占整体数据量的比例过高，则会放弃使用索引，反之则会优先使用索引。但是此规则并不是完美的，有时候可能与你预期的不同，也可以通过一些技巧强制使用索引，但这种方式少用。

举个栗子：

通过上面这个表hospital_statistics_data，我进行了如下查询：

select * from hospital_statistics_data where hospital_code is not null;

此时这个sql会使用到hospital_code的索引吗？

这里也不卖关子了，若hospital_code只有很少一部分数据是null值，那么将不会走索引，反之则走索引。

原因就2个字：回表。

好比去买砂糖橘，如果你只买几斤，那么你随便挑筐里面好的就行。但是如果你要买一筐，我相信老板不会让你在里面一个个挑，而是一次给你一整筐，当然大家都不傻，都知道筐里里面肯定有那么几个坏果子。但是这样效率最高，而且对老板来说损失更小。

执行过程

摘抄自《从根上理解mysql》。我强烈推荐没有系统学过mysql的，看看这本书。

1.首先在server层维护一个count变量

2.server层向InnoDB引擎要第一条记录

3.InnoDB找到第一条二级索引记录，并返回给server层（注意：由于此时只是统计记录数量，所以并不需要回表）

4.由于COUNT函数的参数是*，MySQL会将*当作常数0处理。由于0并不是NULL，server层给count变量加1。

5.server层向InnoDB要下一条记录。

6.InnoDB通过二级索引记录的next_record属性找到下一条二级索引记录，并返回给server层。

7.server层继续给count变量加1。

8.重复上述过程，直到InnoDB向server层返回没记录可查的消息。

9.server层将最终的count变量的值发送到客户端。

总结

写完后还是心中挺郁闷的，现在能从公众号获取到的好文章越来越少了，现在已经是知识付费的时代了。

挺怀念刚工作的时候，那时候每天上午都花点时间看看公众号文章，现在全都是广告。哎！

不过也正常，谁也不能一直为爱发电。

学习还是建议多看看书籍，一般能成书的都不会太差。现在晚上能搜到的都是千篇一律的文章，对错不知。网上

【相关推荐：mysql视频教程】

以上就是count(*)为什么很慢？原因分析的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/351641.html

mysql 后端

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

享界S9增程版3月20日开启小订交互灯语带来专属仪式感

上一篇 2025年11月5日 22:34:53

CentOS下Zookeeper集群如何搭建

下一篇 2025年11月5日 22:34:56

好文分享

网络进化！

Web 应用程序从静态网站到动态网页的演变是由对更具交互性、用户友好性和功能丰富的 Web 体验的需求推动的。以下是这种范式转变的概述： 1. 静态网站（1990 年代）定义：静态网站由用 HTML 编写的固定内容组成。每个页面都是预先构建并存储在服务器上，并且向每个用户传递相同的内容。技术：HT…

程序猿
2025年12月24日
0000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
好文分享

CSS如何实现任意角度的扇形（代码示例）

本篇文章给大家带来的内容是关于CSS如何实现任意角度的扇形（代码示例），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。扇形制作原理，底部一个纯色原形，里面2个相同颜色的半圆，可以是白色,内部半圆按一定角度变化，就可以产生出扇形效果扇形绘制 .shanxing{ position:…

程序猿
2025年12月24日
1000
好文分享

jimdo如何添加html5表单_jimdo表单html5代码嵌入与字段设置【实操】

可通过嵌入HTML5表单代码、启用字段验证属性、添加CSS样式反馈及替换提交按钮并绑定JS事件四种方式在Jimdo实现自定义表单行为。如果您在 Jimdo 网站中需要自定义表单行为或字段逻辑，而内置表单编辑器无法满足需求，则可通过嵌入 HTML5 表单代码实现更灵活的控制。以下是具体操作步骤：一…

程序猿
2025年12月23日
1000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
4000
好文分享

html5怎么设置月份_HTML5用input type=”month”让用户选择年月月份【设置】

HTML5的input type=”month”提供原生年月选择器，格式为“YYYY-MM”，支持value默认值、min/max范围限制、name表单提交，并需JavaScript降级兼容旧浏览器。如果您希望在网页中提供一个简洁的年月选择控件，HTML5 的 input …

程序猿
2025年12月23日
3000
好文分享

html如何登录_使用HTML表单制作登录页面【登录】

需构建语义清晰、可访问性强的HTML登录表单：用method=”post”的form包裹username/password输入框与submit按钮，配label绑定、required验证、placeholder提示，action指向处理地址，并用div+style控制垂直布局…

程序猿
2025年12月23日
1000
好文分享

怎么上传图片html5_html5用FormData或input file上传图片到服务器【上传】

可通过HTML5的FormData与file输入框结合XMLHttpRequest或fetch实现图片上传：一、XMLHttpRequest方式需创建FormData并手动配置xhr；二、fetch方式以Promise风格简化异步流程；三、启用multiple属性可批量上传；四、配合FileRead…

程序猿
2025年12月23日
0000
好文分享

如何在html编辑代码_在HTML页面内编辑和运行代码块【代码】

可在HTML页面内嵌入可交互代码编辑与执行功能，具体包括：一、CodeMirror+Function构造器实现JS即时运行；二、Monaco Editor配合Web Worker与vm2沙箱安全执行；三、iframe隔离预览HTML/CSS/JS；四、BrowserFS模拟本地文件系统。如果您希望…

程序猿
2025年12月23日
0000
好文分享

HTML页面如何开启在线编辑_内容可修改实现方案【解析】

可通过contenteditable属性、TinyMCE等富文本编辑器、designMode整页编辑或Textarea+预览双栏结构实现浏览器内直接编辑HTML。如果您希望用户在浏览器中直接修改HTML页面的内容，而无需进入源代码编辑器，则需要通过前端技术实现可编辑区域。以下是几种可行的实现方案：…

程序猿
2025年12月23日
0000
好文分享

html5如何制作滑动解锁组件_html5滑动解锁手势与验证逻辑【攻略】

滑动解锁组件有四种实现方式：一、原生Touch事件追踪手势；二、Pointer Events跨设备兼容；三、CSS自定义属性声明式控制；四、集成服务端验证的双阶段校验。如果您希望在网页中实现一个滑动解锁组件，需要结合 HTML5 的触摸事件、CSS 动画控制与 JavaScript 验证逻辑。以下…

程序猿
2025年12月23日
0000
html5怎么设置搜索_HTML5用加JS实现搜索框【设置】

需用HTML5语义化标签（如type="search"）构建搜索框，配合JavaScript实现回车/按钮触发、防抖实时搜索及输入校验。 <img src="https://img.php.cn/upload/article/001/503/042/1766392…

程序猿
好文分享 2025年12月23日
0000
好文分享

html中怎么运行sql语句_html中运行sql语句方法【教程】

必须通过后端服务执行SQL操作。一、PHP与MySQL交互：使用PHP脚本在服务器端连接数据库，执行查询并嵌入HTML输出，避免硬编码凭证。二、Ajax调用API：前端通过JavaScript向后端API发送请求，服务端执行SQL并返回JSON数据，前端动态渲染结果。三、SQLite与JavaScr…

程序猿
2025年12月23日
2000
好文分享

html如何输入_在HTML表单中添加输入元素【元素】

在HTML表单中插入下划线需正确使用value、placeholder和label属性，确保原样显示与提交；避免被Markdown等解析器误处理；必要时用pattern正则校验输入是否含下划线。如果您需要在HTML表单中插入一个下划线字符（_）作为输入内容的一部分，或希望用户能在输入框中输入包含下…

程序猿
2025年12月23日
2000
好文分享

如何用代码表白html_用HTML代码创作浪漫表白页面【浪漫】

纯HTML可实现三种浪漫表白页：一、渐变背景+心跳动画文字；二、点击触发淡入弹窗告白；三、滚动逐行浮现诗意情书。均无需后端，保存为.html即可运行。如果您希望用纯 HTML 代码创建一个浪漫的表白页面，无需后端或复杂框架，仅通过结构化标签、内联样式与基础交互即可实现视觉温暖、情感真挚的效果。以下…

程序猿
2025年12月23日
0000
好文分享

html5怎么内嵌表格_HTML5用标签在页面内直接嵌入行列表格【内嵌】

HTML5内嵌表格需用配合等语义化元素；添加border-collapse、边框、padding等style实现可见结构；可用data-purpose等属性标记用途；用overflow-x容器和min-width/max-width实现响应式；必须配或aria-label保障无障碍。如果您希望在H…

程序猿
2025年12月23日
1000
好文分享

html如何返回客户端_HTML页面返回客户端数据操作【操作】

HTML页面向客户端返回数据主要有五种方式：一、用fetch API发送请求并处理JSON响应；二、用XMLHttpRequest手动控制异步请求；三、通过表单提交获取服务端渲染的HTML；四、用localStorage/sessionStorage本地存取数据；五、通过URL参数传递并解析简单信息…

程序猿
2025年12月23日
1000
好文分享

html5如何上传图片_HTML5图片上传实现与表单技巧【教程】

HTML5可通过input file控件、FileReader预览图片，校验类型大小，用FormData提交，并借助Canvas压缩及multiple属性实现批量上传。如果您希望在网页中实现图片上传功能，HTML5 提供了原生的文件选择控件与 JavaScript API 支持，无需依赖第三方插件…

程序猿
2025年12月23日
0000
好文分享

html运行乱码怎么办_解html运行乱码问题【技巧】

解决HTML乱码需确保字符编码统一为UTF-8：1. 在HTML头部添加并保存文件为UTF-8格式；2. 配置服务器返回Content-Type包含charset=utf-8；3. 必要时手动设置浏览器编码为UTF-8；4. 使用编辑器确认并转换文件实际编码；5. 外部资源也需声明UTF-8编码且后…

程序猿
2025年12月23日
0000
好文分享

html5如何拼接网页_HTML5网页拼接技巧与页面整合方法【指南】

HTML5网页拼接有五种原生方法：一、iframe嵌入隔离内容；二、fetch+innerHTML动态注入；三、template元素预定义可复用结构；四、Web Components封装自定义元素；五、Server-Sent Events流式拼接。如果您希望将多个HTML5页面模块组合成一个完整网…

程序猿
2025年12月23日
0000

发表回复

登录后才能评论