深入聊聊mysql索引为什么采用B+树结构

本篇文章是mysql的进阶学习,介绍一下mysql使用b+树作为索引数据结构的原因,希望对大家有所帮助!

深入聊聊mysql索引为什么采用B+树结构

索引提高查询效率,就像我们看的书,想要直接翻到某一章,是不是不用一页一页的翻,只需要看下目录,根据目录找到其所在的页数即可。【相关推荐:mysql视频教程】

在计算机中我们需要一种数据结构来存储这个目录,常见数据结构有哈希表,二叉查找树,二叉平衡树(AVL),红黑树,那为什么Innodb和MyISAM选择b+树呢。

1. 哈希表

哈希表就是一个数组+链表,用下标0,1,2,3….. 表示其数据所在的位置。如果想要在哈希表中存放数据,首先用对这个数据进行散列算法(基本的就是取模运算),假如数组长度是13 ,进行模13之后是0-12,正好对应的数据的下标,如果计算出的下标一样的,就会在下标位置跟上链表。

深入聊聊mysql索引为什么采用B+树结构

缺点:

利用hash存储需要将所有的数据文件添加到内存,比较消耗内存空间。hash的查找是等值查询,速度很快,但是各个数据间没有范围规律,但在实际工作中更多的是范围查询,hash就不太合适了。

不能直接说mysql不使用哈希表,而是要根据存储引擎来确定的,Memory存储引擎使用的就是哈希表

2. 二叉查找树

2.gif

缺点:

如图,极端情况可能会出现倾斜的问题,最后变成链表结构。造成树节点过深,从而增加查找的IO,而现在IO就是查找的瓶颈

3. 二叉平衡树-AVL

为了保持树的平衡,避免出现数据倾斜,需要进行旋转操作,通过左旋或者右旋最终保持最长子树和最短子树长度不能超过1,如果超过1就不是严格意义上AVL树了

3.gif

缺点:

1.当数据量很大的时候,为了保持平衡,需要进行1-n次的旋转,这个旋转是比较浪费性能的,插入和删除效率极低,查询效率很高。

只有两个分支,数据量大的时候树的深度依然很深。

4. 红黑树

最长子树的不能超过最短子树的2倍,通过变色和旋转,在插入和查询上做了平衡

红黑树是avl树的变种,损失了部分查询性能来提高插入性能。

4.gif

缺点:

同样是只有两个分支,数据量大的时候深度依然会很深

以上三种二叉树,随着数据的增多,最终都会出现节点过多的情况,而且他们有且仅有2个分支,那么IO的次数一样很多.

怎么解决仅有2个分支而且深度过深,这就有了B树,增加分支

5. B-Tree

首先不读B减树,读B树所有键值分布在整棵树中。搜索有可能在非叶子结点结束,在关键字全集内做一次查找,性能逼近二分查找。每个结点最多拥有m个子树。根节点至少有2个子树。分支节点至少拥有m/2棵子树(除根节点和叶子节点外都是分支节点)。所有叶子节点都在同一层,每个节点最多可以有m-1个key,并且以升序排列

5.gif

如上图:(图中只是画出来一部分,实际上没有限制的,不止p1,p2,p3)

每个节点占用一个磁盘块,一个节点上有两个升序排列的关键字和三个指向子树根节点的指针,指针存储的是子节点所在的磁盘块地址。两个关键词划分成的三个范围域对应三个指针指向的子树的数据的范围域。以根节点为例,关键字为16和34,p1指针指向的子树的数据范围小于16,p2指针指向的子树的数据范围为16-34,p3指针指向的子树的数据范围大于34。

查找关键字28的过程:

根据根节点找到磁盘块1,读到内存中。【第一次磁盘I/O操作】比较关键字28在区间(16,34),找到磁盘块1的指针p2。根据p2指针找到磁盘块3,读到内存。【第二次磁盘I/O操作】比较关键字28在区间(25,31),找到磁盘块3的指针p2。根据指针p2找到磁盘块8,读到内存。【第三次磁盘I/O操作】在磁盘块8中的关键字列表中找到关键字28,结束。

缺点:

每个节点都有key,同时包含data,而每个页存储空间是有限的,如果data很大的话会导致每个节点能存储的key的数量变小。当存储的数据量很大的时候会导致深度变大,增加查询磁盘的io次数,进而影响查询性能。

6. B+树

B+树是在B树的基础上做的一种优化,变化如下:

B+树每个节点可以包含更多的节点,这个做的原因有两个,第一个原因是为了降低树的高度,第二个原因是将数据范围变成多个区间,区间越多,数据检索越快。非叶子节点只存储key,叶子节点存储key和数据。叶子节点两两指针互相连接(符合磁盘预读的特性),顺序查询性能更高。

6.gif

如上图:在B+树上有两个头指针,一个指向根节点,另一个指向关键字的最小叶子节点,而且所有叶子节点(及数据节点)之间是一种链式环结构,因此可以对B+树进行两种查找运算:一种是对于主键的范围查找和分页查找,另一种是从根节点开始的随机查找。

InnoDB和MyISAM中索引上的差异

1. InnoDB-主键索引

叶子节点存储的是具体的行数据

7.gif

2. InnoDB-非主键索引

非主键索引的叶子节点存储的是主键值(所以查询数据基本要回表)

8.gif

3. MyISAM

叶子节点存储的是行数据的地址,额外需要一次寻址,多一次IO

9.gif

总结:为什么mysql使用的是B+树

准确的表述:为什么mysql的InnoDB和MyISAM存储引擎的索引使用的是B+树

hash表,等值查询是很快的,但是不满足常用的范围查找且相邻的两个值之间没有关系,而且hash比较消耗内存。

二叉树/平衡二叉树/红黑树等都是有且仅有2个分支,共性就是数据量大的时候树的深度变深,增加IO的次数。

B树会在节点上存储数据,这样一页存放的key的数量就会减少,增加树的深度。

B+树中非叶子节点去除了数据,这样就会增加一页中key的数量,而且叶子节点之间是通过链表相连,有利于范围查找和分页。

原文地址:https://juejin.cn/post/6994810803643744269

作者:纪先生

更多编程相关知识,请访问:编程视频!!

以上就是深入聊聊mysql索引为什么采用B+树结构的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/184810.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月1日 09:42:19
下一篇 2025年11月1日 09:46:19

相关推荐

  • Pboot插件数据库连接的配置教程_Pboot插件数据库备份的自动化脚本

    首先配置PbootCMS数据库连接参数,确保插件正常访问;接着创建auto_backup.php脚本实现备份功能;然后通过Windows任务计划程序或Linux Cron定时执行该脚本,完成自动化备份流程。 如果您正在开发或维护一个基于PbootCMS的网站,并希望实现插件对数据库的连接配置以及自动…

    2025年12月6日 软件教程
    000
  • 环境搭建docker环境下如何快速部署mysql集群

    使用Docker Compose部署MySQL主从集群,通过配置文件设置server-id和binlog,编写docker-compose.yml定义主从服务并组网,启动后创建复制用户并配置主从连接,最后验证数据同步是否正常。 在Docker环境下快速部署MySQL集群,关键在于合理使用Docker…

    2025年12月6日 数据库
    000
  • 如何在mysql中分析索引未命中问题

    答案是通过EXPLAIN分析执行计划,检查索引使用情况,优化WHERE条件写法,避免索引失效,结合慢查询日志定位问题SQL,并根据查询模式合理设计索引。 当 MySQL 查询性能下降,很可能是索引未命中导致的。要分析这类问题,核心是理解查询执行计划、检查索引设计是否合理,并结合实际数据访问模式进行优…

    2025年12月6日 数据库
    000
  • 如何在mysql中安装mysql插件扩展

    安装MySQL插件需先确认插件文件位于plugin_dir目录,使用INSTALL PLUGIN命令加载,如INSTALL PLUGIN keyring_file SONAME ‘keyring_file.so’,并确保用户有SUPER权限,最后通过SHOW PLUGINS验…

    2025年12月6日 数据库
    000
  • php查询代码怎么写_php数据库查询语句编写技巧与实例

    在PHP中进行数据库查询,最常用的方式是使用MySQLi或PDO扩展连接MySQL数据库。下面介绍基本的查询代码写法、编写技巧以及实用示例,帮助你高效安全地操作数据库。 1. 使用MySQLi进行查询(面向对象方式) 这是较为推荐的方式,适合大多数中小型项目。 // 创建连接$host = ‘loc…

    2025年12月6日 后端开发
    000
  • 如何在mysql中定期清理过期备份文件

    通过Shell脚本结合cron定时任务实现MySQL过期备份文件自动清理,首先统一备份命名格式(如backup_20250405.sql)并存放在指定目录(/data/backup/mysql),然后编写脚本使用find命令删除7天前的.sql文件,配置每日凌晨2点执行的cron任务,并加入日志记录…

    2025年12月6日 数据库
    000
  • php数据库如何实现数据缓存 php数据库减少查询压力的方案

    答案:PHP结合Redis等内存缓存系统可显著提升Web应用性能。通过将用户信息、热门数据等写入内存缓存并设置TTL,先查缓存未命中再查数据库,减少数据库压力;配合OPcache提升脚本执行效率,文件缓存适用于小型项目,数据库缓冲池优化和读写分离进一步提升性能,推荐Redis为主并防范缓存穿透与雪崩…

    2025年12月6日 后端开发
    000
  • 如何在mysql中使用角色组合优化权限管理

    答案:MySQL角色通过封装权限实现集中管理。创建如app_reader等角色并授予权限,再分配给用户alice并设默认角色,支持组合使用,定期审计并通过系统视图查看,提升安全与运维效率。 在MySQL中,角色(Role)是一种强大的权限管理工具,能够简化用户权限的分配与维护。通过创建角色并将其赋予…

    2025年12月6日 数据库
    000
  • 如何在mysql中使用索引提高查询效率

    合理创建索引可显著提升MySQL查询效率,应优先为WHERE、JOIN、ORDER BY等高频字段建立B-Tree复合索引,如CREATE INDEX idx_status_created ON users(status, created_at, id),并遵循最左前缀原则;避免在索引列使用函数或前…

    2025年12月6日 数据库
    000
  • mysql如何备份存储过程和函数

    最直接且推荐的方式是使用mysqldump工具并添加–routines参数,可完整导出存储过程和函数;若需跨版本迁移,应结合–triggers、处理DEFINER用户、验证SQL_MODE,并在测试环境充分验证恢复与兼容性。 MySQL备份存储过程和函数,最直接且推荐的方式是…

    2025年12月6日 数据库
    000
  • MySQL模糊查询:高效处理含空格和多格式电话号码

    在mysql数据库中,当电话号码字段包含多种格式和空格时,传统的`like`查询可能无法返回预期结果。本文将介绍如何利用`replace`函数在查询时动态移除电话号码中的空格,从而实现准确的模糊匹配。同时,我们还将探讨性能考量及数据标准化等最佳实践,帮助您优化数据库查询和数据质量。 挑战:含空格电话…

    2025年12月6日 后端开发
    000
  • 在Laravel中处理JSON字段并计算每行总和的教程

    本教程旨在指导如何在laravel应用中处理存储为json字符串的数据库字段。我们将通过一个具体示例,展示如何从json字段中提取数值并计算每条记录的总和,并探讨如何通过控制器逻辑和laravel模型访问器实现这一功能,以提高代码的可读性和维护性。 场景描述 在现代Web应用开发中,有时我们需要在数…

    2025年12月6日 后端开发
    000
  • mysql如何设置事务隔离级别

    MySQL支持四种事务隔离级别:READ UNCOMMITTED、READ COMMITTED、REPEATABLE READ和SERIALIZABLE,分别用于控制脏读、不可重复读和幻读问题。默认隔离级别为REPEATABLE READ。可通过SELECT @@transaction_isolat…

    2025年12月6日 数据库
    000
  • 如何在mysql中安装mysql客户端命令行

    答案是安装MySQL客户端的方法因操作系统而异。首先通过mysql –version确认是否已安装,若未安装,则在Ubuntu/Debian系统使用sudo apt install mysql-client,在CentOS/RHEL/Fedora系统使用sudo yum或dnf inst…

    2025年12月6日 数据库
    000
  • mysql中如何排查事务死锁

    首先通过SHOW ENGINE INNODB STATUS查看最近死锁信息,分析事务加锁顺序和SQL语句,定位循环等待原因;再启用innodb_print_all_deadlocks记录所有死锁至错误日志;常见死锁原因为加锁顺序不一致、间隙锁冲突、无索引扫描及长事务;建议统一加锁顺序、添加索引、缩短…

    2025年12月6日 数据库
    000
  • 如何在Laravel中计算JSON字符串字段中各值的总和

    本教程将指导您如何在laravel应用中,从数据库中存储的json字符串字段(例如element_degree)中提取并计算每个记录(如用户)内所有键值对中数值的总和。通过遍历模型集合、解码json数据并累加其内部数值,您可以轻松地为每条记录生成一个聚合总和。 在现代Web开发中,我们经常需要在数据…

    2025年12月6日 后端开发
    000
  • 如何在mysql中排查权限不足导致的错误

    答案是权限配置不当导致MySQL访问被拒。需检查用户是否存在、密码是否正确、权限是否覆盖当前主机和数据库,并通过SHOW GRANTS确认授权,必要时创建用户并授予对应权限,最后执行FLUSH PRIVILEGES生效。 当在 MySQL 中遇到权限不足导致的错误时,通常会看到类似 ERROR 10…

    2025年12月6日 数据库
    000
  • 如何在mysql中使用备份提高灾备能力

    建立完整备份机制是提升MySQL灾备能力的关键,定期使用mysqldump执行全量备份可确保数据可恢复,如:mysqldump -u root -p –all-databases > full_backup.sql。 在MySQL中,通过合理使用备份策略可以显著提升系统的灾备能力。…

    2025年12月6日 数据库
    000
  • 如何在mysql中修改配置文件my.cnf

    答案是修改MySQL配置需找到正确my.cnf文件,编辑[mysqld]段参数如max_connections和innodb_buffer_pool_size,保存后验证语法并重启服务,最后登录数据库用SHOW VARIABLES确认生效,操作前应备份原文件以防启动失败。 在 MySQL 中修改配置…

    2025年12月6日 数据库
    000
  • 在混合存储架构中配置Intel Optane内存作为缓存加速的适用场景分析

    引入Intel Optane内存作为缓存可显著提升混合存储架构性能,其基于3D XPoint技术,兼具低延迟、高耐久性与非易失性,适用于数据库、虚拟化、内容服务及开发测试等场景。在OLTP数据库中,Optane缓存热数据、加速日志写入与索引查询,实测TPS提升30%-50%;在虚拟化环境如VMwar…

    2025年12月6日 电脑教程
    000

发表回复

登录后才能评论
关注微信