MySQL索引知识点分析

程序猿 • 2025年11月4日 11:52:48 • 用户投稿 • 阅读 0

1索引的概念

1.1定义

索引在关系型数据库中，是一种单独的、物理的对数据库表中的一列或者多列值进行排序的一种存储结构，它是某个表中一列或者若干列值的集合，还有指向表中物理标识这些值的数据页的逻辑指针清单。
索引的作用相当于图书的目录，可以根据目录重点页码快速找到所需要的内容，数据库使用索引以找到特定值，然后顺着指针找到包含该值的行，这样可以是对应于表的sql语句执行得更快，可快速访问数据库表中的特定信息。

1.2类型

InnoDB包含三种索引类型，分别为普通索引、唯一索引（主键索引为一种特殊的非空唯一索引）、全文索引。

重写为：普通索引又称非唯一索引，没有任何限制。唯一（Unique）：唯一索引要求键值不能重复（可以为空），主键索引其实是一种特殊的唯一索引，不过他还多了一个限制条件，要求键值不能为空。主键索引用 primary key 创建。全文（Fulltext）：针对比较大的数据，比如我们存放是文章，课文，邮件，等等，有可能一个字段就需要几kb，如果要解决like查询在全文匹配的时候效率低下的问题，可以创建全文索引。仅限于char、varchar、text类型的字段可创建全文索引。MyISAM和InnoDB都支持全文索引。

1.3作用

一句话总结：

索引能够提高数据检索的效率，降低数据库的IO成本。

提出问题：我们用空间换时间，但是他的数据结构、查询的IO成本、以及是如何存储数据的呢?

2索引的数据结构B+树的演进过程

我们以一个 Page 的视角去看我们的B+树演进过程。

页是InnoDB管理存储空间的基本单位，InnoDB将数据库中的数据都是存储在页这个基本存储单位⾥的；页也是内存和磁盘交互的基本单位，数据库从磁盘中读取若⼲个页⼤⼩的数据到内存，也将内存中若⼲个页⼤⼩的数据刷新到磁盘中。⼀个页的内存⼤⼩为16KB。

假设我们要执行这个SQL，得到了10条记录：

SELECT * FROM INNODB_USER LIMIT 0 , 10;

假如一条记录的数据大小是4K，那么我们一个Page页能存多少条数据呢？

16K 除以 4K 得到 4条记录,对吧。

Page里面的每一条数据都有一个关键的属性叫做record_type
0 普通用户记录 1 目录的索引记录 2 最小 3 最大

画个图示例一下页里面数据是怎么放的：

这个是我们的Page页，每个Page页都会存放数据，按照主键有序存放数据

我们知道数据的存储是顺序IO的，方便存放，可是存放方便那查询是不是就不方便了，如果查的是最后一个是不是要遍历整个页的数据？

2.1问题

假如我们要查一条数据要怎么查?怎么才能快速查到数据？

如果我们Page页中的数据是有连接方式的，想想我们学过的数据结构，哪种结构查询快？

如果我们Page页中的数据是有连接方式的，就能够解决啊！没错，就是链表

Page页中的数据是怎么连接的(数据在同一个页中)：

MySQL把页中的数据通过单向链表连接起来，如果是根据主键去查询，使用二分法定位会非常快，如果是根据非主键索引去查，只能从最小的一个个开始遍历单向链表。

多个Page页是怎么建立连接（数据在不同的页中）：

MySQL把不同的页通过双向向链表建立链接，这样我们就可以通过上一页找到下一页，通过下一页找到一页，由于我们现在不能快速定位到数据的所在页，我们只能从第一个页沿着双向链表一直往下找，在每个页中再按照在同一页的方式去查找指定的记录，这个也是全表扫描嘛。

2.2问题

当Page页越来越多，查询会出现什么问题、怎么解决怎么优化？

当我们链表记录变多，由于不能直接定位，我们出现了查询缓慢问题，深入思考，所谓的查询缓慢，其实就是下面两个问题：

查询时间的复杂度0（N）

读写磁盘的IO次数过多

我们想一下，平时看书时，想找某一页的资料，怎么做的？
查目录对不对？目录是个啥？不就是索引嘛！

百度上随便找个目录，贴个图：

我们发现，这个目录里面有两个很重要的信息：

内容简介（章节标题）

所在的页码

我们这个我们参考一个图书的目录的思想来达到我们快速查询数据的目的：

给数据加一个目录，查数据，我们先根据目录页找到数据在哪个页的哪个地方，提升查询性能。

可是，

2.3问题：怎么建目录呢？给每一个页都建一个目录吗？

建目录是不是要有规律？比如字典的目录就是根据字母顺序建立的，你想到了什么？没错就是主键，Mysql里自增的主键刚好符合我们的要求，有规律，内容还少，而且不可重复，真是完美的目录，我们将每一页的主键按规律存储一下，添加一个指针指向数据的位置，查询时直接根据主键大小，用二分法快速找到目录，然后找到数据。
但是我们要给每一个数据页都建目录吗？好像还必须如此，不给每一个页建数据，你怎么定位到页里的数据？难道全页扫描吗？
但是给每一个页都建目录，随着目录页也出现多个，我们一个个目录也去遍历查询性能也会下降。
我们可不可以给目录建一个目录？
于是，我们可以通过为目录页也建立一次目录，向上抽取一层根结点，这样就更加便于我们进行查询了。

这棵树，因为是根据主键存储的，所以我们把它称之为主键索引树，因为主键索引树里存储了我们的表里的所有数据，那么在MySQL中 索引即数据，数据即索引也是这个原因了。

这就是MysqlB+树主键索引树的数据结构，怎么样，是不是比你直接死记硬背得到的知识印象更深刻

2.4索引树、页的分裂与合并

我们找到了提升查询性能的办法，那么，当Page页出现增加、修改、删除，都会遇到什么问题？

如果是有序增加，新增一条数据怎么办？
页写满了，那么是不是得开启一个新页！
并且页的数据必须满足一个条件：下一个数据页中用户记录的主键值必须大于上一个页中用户记录的主键值
因为是有序增加，我们直接在页的双向链表末端增加一个页即可。
那如果是无序增加，新增一条数据怎么办？

飞书知识问答

飞书平台推出的AI知识库管理和智能搜索工具

45 查看详情

开启一个新页，并且找到数据的位置。

把旧数据移动到新页，把新的数据放到有序的位置上。

叶子结点数据一直平移。

触发叶子结点数据Page页的分裂与合并触发上层叶结点和根结点的再次分裂与合并。

这叫什么，“牵一发而动全身”,也叫做页分裂！！

总结：Page页出现增加、修改、删除遇到的问题：

我们可以说，当无序增加、更新主键ID、删除索引页的更新操作时候，会有大量的树结点调整，触发子叶结点Page页和上层叶结点和根节点页的分页与合并，造成大量磁盘碎片，损耗数据库的性能，也就是解释了我们为什么不要在频繁更新修改的列上建索引，或者是不要去更新主键。

让我们总结一下：

聚集索引（聚簇索引）:

主键索引树也叫聚集索引或者是聚簇索引，在InnoDB中一张表只有一个聚集索引树，如果一张表创建了主键索引，那么这个主键索引就是聚集索引，我们是根据聚集索引树的键值，决定数据行的物理存储顺序，我们的聚集索引会对表中的所有列进行排序存储，索引即数据，数据即索引，指的就是我们的主键索引树啦。

2.5根据我们刚才推演的，延申出几个面试题

为什么主键ID最好是趋势递增的？

你刚刚看完啊，不会没记住吧，有序递增，下一个数据页中用户记录的主键值必须大于上一个页中用户的主键值，假如我是趋势递增，存入的数据肯定是在最末尾链表或者新增一个链表，就不会触发页的分裂与合并，导致添加的速度变慢。

三层B+数能存多少数据？

考察点：Page页的大小，B+树的定义
1GB = 1024 M， 1mb = 1024k，1k= 1024 bytes

答：
已知：索引逻辑单元 16bytes 字节，16KB=16* 1024*1024，肯定比一千万多，在InnoDB中B+树的深度为3层就能满足千万级别的数据存储。

mysql 大字段为什么要拆分？

一个Page页可存放16K的数据，大字段占用大量的存储空间，意味着一个Page页可存储的数据条数变少，那么就需要更多的页来存储，需要更多的Page，意味着树的深度会变高。那么磁盘IO的次数会增加，性能下降，查询更慢。大字段不管是否被使用都会存放在索引上，占据大量内存空间压缩Page数据条数。

为什么用B+树？

B+树的底层是多路平衡查找树，对于每一次的查询的都是从根节点触发，到子叶结点才存放数据，根节点和非叶子结点都是存放的索引指针，查找叶子结点互，可以根据键值数据查询。具备更强的扫库、扫表能力、排序能力以及查询效率和性能的稳定性，存储能力也更强，仅使用三层B+树就能存储千万级别的数据。

3什么是二级索引树

刚才看的是根据主键得来的索引，我们如果不查主键，或者说表里压根就没有主键，怎么办？我们还可以根据几个字段来创建联合索引(组合索引聚合索引。。哎呀名字而已怎么叫都行)。

根据主键得到的索引树叫主键索引树，根据别的字段得到的索引树叫二级索引树。

通过下面的SQL 可以建立一个组合索引

ALTER TABLE INNODB_USER ADD INDEXSECOND_INDEX_AGE_USERNAME_PHONE('age','user_name','phone');

其实，看似建立了1个索引，但是你使用 age 查询 age，user_name 查询 age，user_name，phone 都能生效
您也可以认为建立了三个这样的索引：

ALTER TABLE INNODB__USER ADD INDEXSECOND_INDEX_AGE__USERNAME_PHONE('age');ALTER TABLE INNODB_USER ADD INDEXSECOND_INDEX_AGE_USERNAME_PHONE('age','user_name');ALTER TABLE `INNODB_USER`ADD INDEXSECOND_INDEX_AGE_USERNAME_PHONE('age','user_name','phone');

3.1那么二级索引树怎么排序？

首先需要知道参与排序的字段类型是否有有序？

如果是有序字段，就按照有序字段排序比如（int） 1 2 3 4。
如果是无序字段，按照这个列的字符集的排序规则来排序，这点不去深入，知道就好。

我现在有一个组合索引（A-B-C）他会按照你建立字段的顺序来进行排序：
如果A相同按照B排序，如果B相同按照C排序，如果ABC全部相同，会按照聚集索引进行排序。

我们的Page会根据组合索引的字段建立顺序来存储数据，年龄用户名手机号。
它的数据结构其实是一样的

3.2索引桥的概念是什么呢（最左匹配原则）？

还是上面那个索引，年龄用户名手机号，age,username,phone
那么可以看到我们第一个字段是AGE，如果需要这个索引生效，是不是在查询的时候需要先使用Age查询，然后如果还需要user_name，就使用user_name。

只使用了user_name 能使用到索引吗？
其实是不行的，因为我是先使用age进行排序的，你必须先命中age，再命中user_name，再命中phone，这个其实
就是我们所说的最左匹配原则。

最左其实就是因为我们是按照组合索引的顺序来存储的。大家常说的”索引桥”也是这个原因。在命中组合索引中，必须像过桥一样，先跨过第一块木板，再到第二块木板，最后到第三块木板。

3.3回表、覆盖索引、索引下推

二级索引树有三个重要的概念，分别是回表、覆盖索引、索引下推。.

回表就是：我们查询的数据不在二级索引树中需要拿到ID去主键索引树找的过程。

覆盖索引就是：我们需要查询的数据都在二级索引树中，直接返回这种情况就叫做覆盖索引。
索引下推（index condition pushdown ）简称ICP：在Mysql5.6以后的版本上推出，用于优化回表查询；

3.4延申几个面试题：

为什么离散度低的列不走索引？

离散度是什么概念？相同的数据越多离散度越低，相同的数据越少离散度就越高。
请问都是相同的数据，怎么排序？没办法排序啊？
在B+Tree 里面重复值太多，MySQL的优化器发现走索引跟使用全表扫描差不了多少的时候，就算建立了索引也不会走。走不走索引，是MySQL的优化器去决定的。

索引是不是越多越好？

空间上：用空间换时间，索引是需要占用磁盘空间的。
时间上：命中索引，加快我们的查询效率，如果是更新删除，会导致页的分裂与合并，影响插入和更新语句的响应时间，反而延缓性能。
如果是频繁需要更新的列，不建议建立索引，因为频繁触发页的分裂与合并。

3.5二级索引树的总结

也叫作组合索引（复合索引），二级索引树存储的是我们创建索引时候的保存了列名顺序来存储的，它只保存了创建二级索引列名的部分数据，二级索引树是为了辅助我们查询，提高查询效率诞生的，二级索引树里有三个动作：回表、覆盖索引、索引下推。其中，性能最高的是覆盖索引。

4主键索引与二级索引的区别

网上找了一张区别图

以上就是MySQL索引知识点分析的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/269893.html

mysql

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

速卖通怎么看同行数据？又该如何分析？速卖通同行数据分析指南：从数据获取到竞争策略优化

上一篇 2025年11月4日 11:52:47

如何解决PHP异步编程的“等待”困境，使用Composer和GuzzlePromises助你构建高性能应用！

下一篇 2025年11月4日 11:52:49

用户投稿

开源免费PHP工具 PHP开发效率提升利器

推荐开源免费PHP开发工具以提升效率：VS Code、Sublime Text轻量高效，PhpStorm专业强大；调试用Xdebug、Kint、Ray；依赖管理选Composer；代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer；数据库管理可用%ignore_a_1%MyA…

程序猿
2026年5月10日
0000
MySQL数据库不支持中文的解决办法

接上一篇文章，在解决了mysql+flask环境配置问题之后，往数据库存中文字符串会报1366错误，提示不正确的字符。继而发现默认的mysql采用了latin1字符集，这种编码是不支持中文的。如果想支持中文的话，需要设置一下mysql字符集。众所周知utf-8是可以的，gbk也没问题，为了可扩展…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

Go语言连接外部MySQL数据库：DSN配置与常见错误解析

本文详细阐述了go语言使用`go-sql-driver/mysql`驱动连接外部mysql数据库的正确方法。重点介绍了数据源名称（dsn）的规范格式，特别是主机地址部分的配置，以避免常见的“getaddrinfow: the specified class was not found.”等网络解析错…

程序猿
2026年5月10日
0000
用户投稿

后缀php怎么打开_php文件打开方式与运行环境搭建指南

要打开PHP文件需根据用途选择方式：查看代码可用文本编辑器或IDE，运行则需服务器环境。推荐新手使用XAMPP、WAMP等集成环境，将文件放入htdocs目录后访问localhost；开发者可利用PHP内置服务器，命令行执行php -S localhost:8000运行；高级用户可手动配置Apach…

程序猿
2026年5月10日
0000
用户投稿

PHP动态网页数据库备份恢复_PHP动态网页MySQL数据库备份教程

答案：PHP动态网页的MySQL数据库备份与恢复需通过定期导出SQL文件并安全存储来保障数据安全，核心方法包括使用mysqldump命令行工具实现高效灵活的自动化备份，利用phpMyAdmin图形化工具进行手动导出导入以降低操作门槛，以及通过PHP脚本调用系统命令将备份过程集成到应用中；恢复时可采用…

程序猿
2026年5月10日
0000
php登录怎么实现_php用户登录系统完整实现

<blockquote>PHP用户登录系统的核心是安全验证与会话管理。首先创建POST提交的登录表单，避免敏感信息暴露；后端通过session_start()启动会话，使用trim()和htmlspecialchars()清理输入，防止XSS攻击；利用PDO预处理语句查询数据库，防止SQ…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

远程MySQL数据库连接指南：从本地PHP应用访问GCP实例数据库

本文详细指导如何在本地php应用中连接到google cloud platform (gcp) 虚拟机实例上的远程mysql数据库。教程涵盖了数据库连接参数的配置、使用php pdo建立连接的方法、gcp环境下的网络配置要点，以及常见的安全和故障排除建议，旨在帮助开发者顺利实现跨环境的数据库通信。 …

程序猿
2026年5月10日
0000
用户投稿

在PHP中实现MySQL数据插入时避免重复记录的策略

本文将探讨在php应用中向mysql数据库插入数据时，如何有效避免重复记录的产生。针对当主键或唯一索引字段值已存在的情况，我们将介绍使用`insert ignore`语句的策略，以确保数据完整性并防止不必要的重复插入，从而简化数据管理逻辑。引言：数据完整性与重复记录问题在数据库管理中，数据完整性…

程序猿
2026年5月10日
0000
用户投稿

php实现哪些功能

PHP是一种通用脚本语言，可用来实现广泛的功能，包括：动态Web开发：生成响应用户请求的动态 веб页面。内容管理系统（CMS）：构建允许用户管理网站内容的CMS。电子商务：开发具有购物车、订单处理和支付网关集成的电子商务网站。服务器端编程：编写命令行脚本和工具。文件操作：创建、读取、写入和删除文件…

程序猿
2026年5月10日
0000
用户投稿

PHP 动态 SQL WHERE 子句构建：避免重复 AND 的策略

本文探讨了在 php 中动态构建 sql 查询 `where` 子句时常见的“`where and`”语法错误及其解决方案。通过逐步构建条件字符串，确保第一个条件不带 `and`，后续条件正确使用 `and` 连接，从而生成符合 sql 规范的查询语句，提高代码的健壮性和可读性。动态构建 SQL …

程序猿
2026年5月10日
2000
用户投稿

PHP中基于用户角色的页面访问控制实践

本教程详细讲解如何在PHP应用程序中利用会话（Session）机制实现基于用户角色的页面访问控制。通过正确的session_start()调用、用户登录时的角色信息存储，以及在受保护页面进行严格的会话和角色类型检查，确保只有特定用户（如“manager”）才能访问指定页面，从而有效防止未经授权的访问…

程序猿
2026年5月10日
1000
用户投稿

php数据库触发器应用实例_php数据库自动化任务的处理

通过MySQL触发器与PHP结合，可在数据变更时自动记录日志、校验数据及同步状态。首先创建user_log表并定义AFTER INSERT/UPDATE/DELETE触发器，记录users表的操作信息；随后使用PHP的PDO执行增删改操作，验证日志生成；接着创建BEFORE INSERT触发器限制非…

程序猿
2026年5月10日
0000
用户投稿

php数据库数据压缩处理_php数据库存储空间优化方法

可通过启用MySQL行压缩、PHP层数据压缩、优化字段结构及分表归档策略减少存储占用。具体步骤：1. 使用InnoDB压缩表并设置KEY_BLOCK_SIZE；2. PHP中用gzcompress压缩大数据字段，存为BLOB；3. 选用更小数据类型如TINYINT，避免冗余TEXT；4. 将历史数据…

程序猿
2026年5月10日
0000
用户投稿

php数据整理怎么按日期字段分组汇总_php按日期分组统计与时间段合并技巧

可使用SQL或PHP对数据按日期分组汇总。1、通过MySQL的DATE()、YEAR()、MONTH()函数在查询时按日、月、年分组统计；2、在PHP中遍历数组，以date(‘Y-m-d’)等格式化日期作为键进行归类；3、按周可使用date(‘o-W’…

程序猿
2026年5月10日
0000
用户投稿

php数据库如何实现全文搜索 php数据库搜索引擎的构建方法

答案：在PHP项目中实现数据库全文搜索需利用MySQL的FULLTEXT索引功能，通过PDO预处理语句执行MATCH()…AGAINST()查询，结合PHP过滤用户输入以防止SQL注入；为提升体验可引入中文分词、权重排序、结果高亮等优化措施；数据量增长后可迁移至Elasticsearch…

程序猿
2026年5月10日
0000
用户投稿

php调用数据同步方案_php调用多数据库数据同步

首先明确同步需求与模式，如单向、双向、定时或实时同步；接着使用PHP通过PDO连接多数据库，基于时间戳或增量ID同步变更数据，并记录同步状态；为提高可靠性，可引入消息队列、binlog解析、中间同步层及加锁机制；最后注意网络超时、分页处理、错误重试、日志记录与测试验证，确保数据一致性与系统稳定性。 …

程序猿
2026年5月10日
0000
用户投稿

php怎么安装_在云服务器上部署PHP环境的步骤

答案：在云服务器上部署PHP环境需搭建LEMP栈（Linux+Nginx+MySQL+PHP-FPM），依次更新系统、安装Nginx、MariaDB、PHP-FPM及扩展，配置Nginx解析PHP并测试，最后通过权限控制、安全配置、防火墙和HTTPS等措施保障环境安全稳定。在云服务器上部署PHP环…

程序猿
2026年5月10日
0000
用户投稿

使用MySQL和PHP高效获取最热门数据条目：统计与排序实践

本教程详细阐述如何利用mysql的聚合函数和php的mysqli扩展，高效地从数据库中查询并排序出最常出现的数据条目。文章将通过一个具体的案例，指导读者构建正确的sql查询，并结合php进行数据处理和调试，避免常见的sql语法错误和php运行时问题，从而准确获取按频率降序排列的热门数据。在Web开…

程序猿
2026年5月10日
0000
用户投稿

SQL查询：精确判断事件过期，结合日期与时间列

本文旨在解决数据库中事件过期判断不精确的问题，特别是当事件的过期日期和时间分别存储在不同列时。我们将探讨两种主流的sql查询策略：一种是利用逻辑运算符`or`和`and`进行分情况判断，另一种是通过合并日期和时间列为单一时间戳进行直接比较。文章将详细阐述每种方法的实现方式、适用场景及相关注意事项，确…

程序猿
2026年5月10日
1000
用户投稿

HTML表单如何实现白名单功能？怎样只允许授权用户？

要实现%ignore_a_1%的白名单功能并确保只有授权用户操作，核心答案是必须依赖后端服务器进行严格的身份认证、会话管理、授权检查和数据验证，前端仅能提供用户体验层面的初步提示而不能保障安全；具体而言，首先通过用户身份认证（如用户名/密码或oauth）确认用户身份，服务器创建会话并返回标识符，后续…

程序猿
2026年5月10日
8000