MYSQL索引最佳实践

你做了一个明智的选择

理解索引对开发和dba来说都是极其重要

差劲的索引对产品问题负相当大的一部分责任

索引不是多么高深的问题

MySQL 索引一览表

理解索引

为你的应用创建最佳索引

拥抱MySQL的限制

简述索引

索引有什么用

为从数据库读取数据加速

强制约束 (唯一索引 UNIQUE, 外键 FOREIGN KEY)

没有任何索引的情况下查询页能正常运行

但是那可能需要执行很长的时间

你可能听说过的索引类型

BTREE索引 – mysql中主要的索引类型

RTREE索引 – 只有MyISAM支持, 用于GIS

HASH 索引 – MEMORY, NDB 支持

BITMAP 索引 – MySQL 不支持

FULLTEXT 索引 – MyISAM, Innodb(MySQL 5.6以上支持)

类BTREE索引家族

有很多不同的实现

在可加速的操作中共享相同的属性

内存相比硬盘使生活变得美好

B+树通常用于硬盘存储

数据存储于叶子节点

B+Tree 示例

t0128f824aa7ed65fdd.png

MyISAM、Innodb索引对比

MyISAM

数据指针指向数据文件中的物理位置

所有索引都是一样的(指向物理位置))

Innodb

主键索引 (显式或隐式) – 直接将数据存储于索引的叶子节点,而不是指针

二级索引 – 保存主键索引的值作为数据指针

BTREE索引能用于什么操作 ?

查询所有 KEY=5 的记录 (点查询)

查询所有 KEY>5 的记录 (开合间)

查询所有 5<KEY<10 的记录 (闭合间)

不适用于:查询KEY最后一个数字等于0的所有记录

因为这不能定义为范围查询操作

字符索引

这(和数值)没什么区别… 真的

collation是为字符串定义的排序规则

如: “AAAA” < “AAAB”

前缀LIKE 查询是一种特殊的范围查询

LIKE “ABC%” 的意思是:

“ABC[最小值]”<KEY<“ABC[最大值]”

LIKE “%ABC” 无法使用索引查询

联合索引

是这样进行排序的, 比较首列,然后第二列,第三列以此类推,如:

KEY(col1,col2,col3)

(1,2,3) < (1,3,1)

使用一个BTREE索引,而不是每个层级一个单独的BTREE索引

索引的开销

索引是昂贵的,不要添加多余的索引

多数情况下,扩展索引比添加一个新的索引要好

写 – 更新索引常常是数据库写操作的主要开销

读 – 需要再硬盘和内存开销空间; 查询优化中需要额外的开销

索引成本的影响

长主键索引(Innodb) – 使所有相应的二级索引 变得更长、更慢

“随机”主键索引(Innodb) – 插入导致大量的页面分割

越长的索引通常越慢

Index with insertion in random order – SHA1(‘password’)

低区分度的索引是低劣的 – 在性别字段建的索引

相关索引是不太昂贵的– insert_time与自增id是相关的

Innodb表的索引

数据按主键聚集

选择最佳的字段作为主键

比如评论表 – (POST_ID,COMMENT_ID) 是作为主键的不错选择,使得单个post的评论聚在一起

或者 “打包” 单个 BIGINT(字段)

主键隐式地附加到所有索引中

KEY (A) 实质上是 KEY (A,ID)

覆盖索引,有利于排序

MySQL是如何使用索引的

查询

排序

避免读取数据(只读取索引)

其他专门的优化

使用索引进行查询

SELECT * FROM EMPLOYEES WHERELAST_NAME=“Smith”

这是典型的索引 KEY(LAST_NAME)

可以使用复合索引

SELECT * FROM EMPLOYEES WHERELAST_NAME=“Smith” AND DEPT=“Accounting”

将会使用索引 KEY(DEPT,LAST_NAME)

复合索引比较复杂

Index (A,B,C) – 字段顺序问题

下列情形将会使用索引进行查询(全条件)

A>5

A=5 AND B>6

A=5 AND B=6 AND C=7

A=5 AND B IN (2,3) AND C>5

下列条件将不会使用索引

B>5 – 条件没有B字段前的A

B=6 AND C=7 – 条件没有B、C字段前的A

以下情形使用索引的一部分

A>5 AND B=2 – 第一个字段A的范围查询,导致只用上了索引中A字段的部分

A=5 AND B>6 AND C=2 – B字段的范围范围查询,导致只使用了索引中A和B两个字段的部分

MySQL优化器的第一法则

在复合索引中,MySQL在遇到返回查询(,BETWEEN)时,将停止中止剩余部分(索引)的使用;但是使用IN(…)的”范围查询”则可以继续往右使用索引(的更多部分)

所用索引进行排序

SELECT * FROM PLAYERS ORDER BY SCOREDESC LIMIT 10

将使用索引 KEY(SCORE)

不使用索引将进行非常昂贵的“filesort”操作(externalsort)

常常使用组合索引进行查询

SELECT * FROM PLAYERS WHERE COUNTRY=“US”ORDER BY SCORE DESC LIMIT 10

最佳选择是 KEY(COUNTRY,SCORE)

高效排序的联合索引

变得更加受限!

KEY(A,B)

以下情形将会使用索引进行排序

ORDER BY A – 对索引首字段进行排序

A=5 ORDER BY B – 对第一个字段进行点查询,对第二个字段进行排序

ORDER BY A DESC, B DESC – 对两个字段进行相同的顺序进行排序

A>5 ORDER BY A – 对首字段进行范围查询,并对首字段进行排序

以下情形将不使用索引进行排序

letterdrop letterdrop

B2B内容营销自动化平台,从创意到产生潜在客户的内容的最佳实践和工具

letterdrop 15 查看详情 letterdrop

ORDER BY B – 对第二个字段进行排序(未使用首字段)

A>5 ORDER BY B – 对首字段进行范围查询,对第二个字段进行排序

A IN(1,2) ORDER BY B – 对首字段进行IN查询,对第二个字段进行排序

ORDER BY A ASC, B DESC – 对两个字段进行不同顺序的排序

MySQL使用索引排序的规则

不能对两个字段进行不同顺序的排序

对非ORDER BY部分的字段只能使用点查询(=)– 在这种情形下,IN()也不行

避免读取数据(只读取索引)

“覆盖索引”– 这里指 适用于特定查询的索引,而不是一种索引的类型

只读取索引,而不去读取数据

SELECT STATUS FROM ORDERS WHERECUSTOMER_ID=123

KEY(CUSTOMER_ID,STATUS)

索引通常比数据本身要小

(索引)读取起来更有次序– 读取数据指针通常是随机的

Min/Max的优化

索引可以帮助优化 MIN()/MAX() 这类的统计函数– 但只包含以下这些:

SELECT MAX(ID) FROM TBL;

SELECT MAX(SALARY) FROM EMPLOYEEGROUP BY DEPT_ID

将受益于 KEY(DEPT_ID,SALARY)

“Using index for group-by”

联表查询中索引的使用

MySQL 使用 “嵌套循环(Nested Loops)”进行联表查询

SELECT * FROM POSTS,COMMENTS WHEREAUTHOR=“Peter” AND COMMENTS.POST_ID=POSTS.ID

扫描表POSTS查询所有复合条件的 posts

循环posts 在表COMMENTS 中查找 每个post的所有comments

使每个关联的表(关联字段)都使用上索引显得非常的重要

索引只有在被查询的字段上是必要的– POSTS.ID字段的索引再本次查询中是用不上的

重新设计不能很好的所有索引的联合查询吧

使用多索引

MySQL可以使用超过1个索引

“索引合并”

SELECT * FROM TBL WHERE A=5 AND B=6– 可以分别使用索引 KEY(A)和 KEY(B)

索引 KEY(A,B) 是更好的选择

SELECT * FROM TBL WHERE A=5 OR B=6– 两个索引同时分别被使用

索引 KEY(A,B) 在这个查询中无法使用

前缀索引

你可以在字段最左前缀建立索引

ALTER TABLE TITLE ADD KEY(TITLE(20));

需要对BLOB/TEXT类型的字段建立索引

能显著的减少空间使用

不能用于覆盖索引

选择前缀长度成为一个问题

选择前缀长度

前缀应该有足够的区分度

比较distinct前缀、distinct整个字段的值

mysql> select count(distinct(title)) total,count(distinct(left(title,10))) p10,count(distinct(left(title,20))) p20 from title;

t0128f824aa7ed65fdd.png

1 row in set (44.19 sec)

检查异常值

确保不会有很多记录使用相同的前缀

使用最多的Titlemysql> select count(*) cnt, title tl from title group by tl order by cnt desc limit 3;

t0128f824aa7ed65fdd.png

3 rows in set (27.49 sec)

使用最多的Title 前缀 mysql> select count(*) cnt, left(title,20) tl from title group by tl order by cnt desc limit 3;

t0128f824aa7ed65fdd.png

3 rows in set (33.23 sec)

MySQL如何选择使用哪个索引的?

每次查询动态选择– 查询文本中常量很重要

评估需要查询的行数 对给定的索引,在表中进行”dive”

如果(dive)不可行时,使用 “Cardinality” 进行统计– 这是进行 ANALYZE TABLE时 更新的

更多关于索引的选择

并不只是最小化扫描行数

很多其他的heuristics(尝试) and hacks– 对Innodb来说主键是很重要的

覆盖索引效益

Full table scan is faster, all being equal(这句不是太明白)

我们也可以使用索引进行排序

须知

验证MYSQL实际使用的执行计划

注意是可以根据常量和数据动态改变的

使用EXPLAIN

EXPLAIN 是一个很好的工具,可以看到MYSQL将如何进行查询

mysql> explain select max(season_nr) from title group by production_year;

http://dev.mysql.com/doc/refm…

记住,真实的查询可能跟执行计划不同

t0128f824aa7ed65fdd.png

1 row in set (0.01 sec)

MySQL Explain 101

“type” 从好到差排序如下:– system,const,eq_ref,ref,range,index,ALL

注意 “rows” – 更大的数值意味着更慢的查询

检查 “key_len” – 显示索引的哪些部分真实使用到了

留意”Extra”

Using Index – 好

Using Filesort, Using Temporary – 差

索引策略

为你的关键性能查询集建立索引– 整体取审视他们,而不是一个个看

最好所有的查询条件和联表条件都使用索引– 起码区分度最高的部分是

一般来说,可以的话,扩展索引,而不是创建新的索引

修改时记得验证对性能的影响

索引策略示例

按能支持更多查询的顺序建立索引

SELECT * FROM TBL WHERE A=5 AND B=6

SELECT * FROM TBL WHERE A>5 AND B=6– 对两个查询来说 KEY(B,A) 是更好的选择

把所有都是点查询的字段放到索引的首位

不要添加非性能关键查询的索引– 太多的索引会使MYSQL慢下来

Trick #1: 枚举范围

KEY (A,B)

SELECT * FROM TBL WHERE A BETWEEN 2AND 4 AND B=5

将只使用索引的第一个字段部分

SELECT * FROM TBL WHERE A IN (2,3,4) ANDB=5

索引的两个字段部分都使用

Trick #2: 添加一个假的条件

KEY (GENDER,CITY)

SELECT * FROM PEOPLE WHERE CITY=“NEWYORK”

完全用不上索引

SELECT * FROM PEOPLE WHERE GENDER IN(“M”,”F”) AND CITY=“NEW YORK”

将用上索引

这个Trick在低区别度的字段上可以很好的使用

Gender, Status, Boolean Types etc

Trick #3: 虚实Filesort

KEY(A,B)

SELECT * FROM TBL WHERE A IN (1,2) ORDER BYB LIMIT 5;

无法使用索引进行排序

(SELECT FROM TBL WHERE A=1 ORDER BY B LIMIT 5) UNION ALL (SELECT FROM TBL WHERE A=2 ORDER BY B LIMIT 5) ORDER BY B LIMIT 5;

将会用上索引,而“filesort”只用于对不超过10行记录

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1082322.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月2日 19:11:55
下一篇 2025年12月2日 19:12:16

相关推荐

  • MyBatis 中 XML 映射文件无法调用的问题排查与解决

    本文旨在帮助开发者解决在使用 Spring Boot 和 MyBatis 框架时,XML 映射文件中定义的 SQL 语句无法被正确调用的问题。文章将通过分析常见原因、提供解决方案以及代码示例,帮助读者快速定位并解决类似问题,确保 MyBatis 能够正确加载和执行 XML 映射文件中的 SQL 语句…

    2025年12月5日
    500
  • 如何解决PHP中货币数值处理和格式化难题,使用Spryker/Money让财务计算更精确

    最近在开发一个电商平台时,我遇到了一个让人头疼的问题:如何精确地处理和展示商品价格、订单总额等货币数值。PHP中的浮点数计算众所周知地不可靠(比如 0.1 + 0.2 并不严格等于 0.3 ),这在财务计算中是绝对不能接受的。更麻烦的是,我们的平台面向全球用户,这意味着我需要根据不同的国家和地区,以…

    开发工具 2025年12月5日
    000
  • win10关闭自动更新 四种禁止更新方法分享

    windows 10系统内置了自动更新机制,虽然有助于保持系统安全与稳定,但对不少用户来说,频繁的更新提示、计划外的重启甚至强制重启严重影响了使用体验。尤其是在进行重要工作或沉浸式游戏时,突如其来的系统更新极易打断操作流程。那么,如何有效关闭win10的自动更新呢?本文将介绍四种实用、安全且可逆的方…

    2025年12月5日 电脑教程
    600
  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • MySQL ERROR 1045出现的原因及怎么解决

    在命令行输入mysql -u root –p,输入密码,或通过工具连接数据库时,经常出现下面的错误信息,相信该错误信息很多人在使用mysql时都遇到过。 ERROR 1045 (28000): Access denied for user ‘root’@’loca…

    2025年12月5日 数据库
    000
  • 如何在Laravel中集成支付网关

    在laravel中集成支付网关的核心步骤包括:1.根据业务需求选择合适的支付网关,如stripe、paypal或支付宝等;2.通过composer安装对应的sdk或laravel包,如stripe/stripe-php或yansongda/pay;3.在.env文件和config/services.…

    2025年12月5日
    300
  • Java中死锁如何避免 分析死锁产生的四个必要条件

    预防死锁最有效的方法是破坏死锁产生的四个必要条件中的一个或多个。死锁的四个必要条件分别是互斥、占有且等待、不可剥夺和循环等待;其中,互斥通常无法破坏,但可以减少使用;占有且等待可通过一次性申请所有资源来打破;不可剥夺可通过允许资源被剥夺打破;循环等待可通过按序申请资源解决。此外,reentrantl…

    2025年12月5日 java
    300
  • 误删回收站文件怎么恢复 试试这几种恢复方法

    在清理电脑回收站以腾出磁盘空间时,有时会不小心将重要文件一并清空。那么,一旦回收站被清空,这些文件是否就彻底无法找回了呢?其实不然,只要这些文件尚未被新数据覆盖,仍有机会完整恢复。本文将介绍几种实用且高效的恢复方式,助你尝试找回误删的文件。 一、借助“文件历史记录”功能进行恢复 Windows系统内…

    2025年12月5日 电脑教程
    000
  • linux上安装docker容器和mysql镜像拉取的方法

    docker pull xxxx 拉取镜像 docker run -it xxxx /bin/bash 启动镜像 启动docker服务 docker ps 查询运行中的容器 docker ps -a 查询所有容器,包括未运行的 mysql容器启动:docker run -itd –nam…

    数据库 2025年12月5日
    000
  • js如何实现剪贴板历史 js剪贴板历史管理的4种技术方案

    要实现js剪贴板历史,核心在于拦截复制事件、存储复制内容并展示历史记录。1. 使用document.addeventlistener(‘copy’)监听复制事件,并通过e.clipboarddata.getdata获取内容;2. 用localstorage或indexeddb…

    2025年12月5日 web前端
    100
  • 如何利用JavaScript实现前端日志记录与用户行为分析?

    前端日志与用户行为分析可通过封装Logger模块实现,支持分级记录并上报;结合事件监听自动采集点击、路由变化等行为数据。 前端日志记录与用户行为分析能帮助开发者了解用户操作路径、发现潜在问题并优化产品体验。通过JavaScript,我们可以轻量高效地实现这些功能,无需依赖复杂工具也能获取关键数据。 …

    2025年12月5日
    000
  • 喜茶微信点单怎么用抖音券:详细教程及优惠攻略

    【引言】 作为新式茶饮的领军品牌,喜茶凭借其高品质原料与持续创新的产品赢得了广大消费者的喜爱。为提升服务效率与用户体验,喜茶全面上线了微信小程序点单功能,让用户无需排队即可完成下单。与此同时,喜茶携手抖音平台推出专属优惠活动——抖音券,进一步降低消费门槛。本文将为您全面解析如何在喜茶微信点单时使用抖…

    2025年12月5日
    000
  • win11怎么创建和挂载ISO镜像文件_Win11创建与挂载ISO虚拟光驱的方法

    Windows 11支持直接挂载ISO镜像作为虚拟光驱。1、右键ISO文件选择“挂载”即可在“此电脑”中显示为DVD驱动器;2、通过管理员权限的PowerShell使用Mount-DiskImage命令可实现命令行挂载;3、创建ISO文件可借助PowerShell或第三方工具如Oscdimg,将文件…

    2025年12月5日
    000
  • 抖音的私信定位在哪里?私信功能有什么作用?

    作为广受欢迎的社交平台,抖音中的私信功能是用户沟通的重要方式之一。然而不少刚接触抖音的朋友常常困惑:私信到底在哪?它又能用来做什么? 一、抖音私信入口在哪里? 其实,抖音的私信入口设计得十分直观,主要分布在手机App和电脑端两个场景中。 手机端抖音App 这是大多数用户使用的操作方式,主要有两个常用…

    2025年12月5日
    000
  • 如何在Laravel中实现缓存机制

    laravel的缓存机制用于提升应用性能,通过存储耗时操作结果避免重复计算。1. 配置缓存驱动:在.env文件中设置cache_driver,如redis,并安装相应扩展;2. 使用cache facade进行缓存操作,包括put、get、has、forget等方法;3. 使用remember和pu…

    2025年12月5日
    000
  • 如何解决前端JS文件过大导致加载缓慢的问题,使用linkorb/jsmin-php助你轻松实现JS代码压缩优化

    可以通过一下地址学习composer:学习地址 在快节奏的互联网世界里,网站的加载速度是用户体验的生命线。用户往往没有耐心等待一个缓慢的页面,而搜索引擎也更青睐加载迅速的网站。作为一名开发者,我深知这一点,但最近在优化我的php项目时,却遇到了一个让人头疼的问题:前端的javascript文件随着功…

    开发工具 2025年12月5日
    000
  • Java中Executors类的用途 掌握线程池工厂的创建方法

    如何使用executors创建线程池?1.使用newfixedthreadpool(int nthreads)创建固定大小的线程池;2.使用newcachedthreadpool()创建可缓存线程池;3.使用newsinglethreadexecutor()创建单线程线程池;4.使用newsched…

    2025年12月5日 java
    000
  • ubuntu下mysql 8.0.28怎么安装配置

    修改密码改了挺长时间,记录下安装过程 安装ssh服务: sudo apt-get install openssh-server 启动ssh服务: service sshd start 安装mysql服务器端: sudo apt install -y mysql-server 安装mysql客户端: …

    2025年12月5日
    000
  • js如何解析XML格式数据 处理XML数据的4种常用方法!

    在javascript中解析xml数据主要有四种方式:原生domparser、xmlhttprequest、第三方库(如jquery)以及fetch api配合domparser。使用domparser时,创建实例并调用parsefromstring方法解析xml字符串,返回document对象以便…

    2025年12月5日 web前端
    100
  • 解决WordPress博客首页无法显示页面标题的问题

    摘要:本文针对WordPress主题开发中,使用静态页面作为博客首页时,home.php无法正确显示页面标题的问题,提供了详细的解决方案。通过使用get_the_title()函数并结合get_option(‘page_for_posts’)获取文章页面的ID,从而正确显示博…

    2025年12月5日
    000

发表回复

登录后才能评论
关注微信