我所理解的MySQL之一：基础架构

程序猿 • 2025年11月6日 00:31:28 • 用户投稿 • 阅读 5

今天MySQL教程栏目为大家介绍我所理解的基础架构。

作为一个正经的 crud 工程师，与数据库的交互是日常工作中比重较大的内容，比如日常迭代的增删改查、处理历史数据、优化 sql 性能等等。随着项目数据量的增长，从前为了赶项目进度而埋下的深坑正慢慢显露它们的威力，这也让我不得不全面且深入的学习 mysql，而不仅仅是停留在基础的 crud 上。

MySQL 系列的第一篇，主要介绍 MySQL 的基础架构以及各个组成部分的功能，包括 Server 层的 bin log 和 InnoDB 特有的 redo log 这两种日志模块。

1. MySQL 架构简介

根据 DB-Engines 发布的最受欢迎的数据库管理系统排行榜，MySQL 稳坐第二把交椅。

作为最受欢迎的关系型数据库管理系统之一，MySQL 采用的是C/S架构，即 Client & Server 架构。比如开发者使用 Navicat 连接到 MySQL，那么前者就是客户端，后者就是服务端。

同时，MySQL 也是单进程多线程的数据库。这很好理解，正在运行的 MySQL 实例就是那个“单进程”，而在这个进程中会有很多个线程，比如主线程 Master Thread，IO Thread 等，这些线程被用于处理不同的任务。

2. MySQL 组成部分

前面说到 MySQL 采用的是C/S架构，用户通过客户端连接到 MySQL 服务器，然后提交 SQL 语句到服务器，然后服务器就会把执行结果返回给客服端。

在这一小节的内容中，我们主要关注 MySQL 服务端的逻辑组成，先来看一张图。

从上图可以看到，与客户端的交互中，MySQL 的服务端分别经过了连接器、查询缓存、分析器、优化器、执行器和存储引擎这几部分。

下面就以一条简单的查询语句来描述 MySQL 服务端的各组成部分及它们所起的作用。

2.1 连接器

在客户端提交查询语句之前，需要与服务端建立连接。所以最先来到的是连接器，连接器的作用就是负责与客户端建立、管理连接，同时查询用户的权限。

需要注意的是：

连接器只获取用户的权限，并不做校验，校验是在查询缓存或执行器才进行。一旦建立连接同时获取用户的权限之后，只有建立新的连接才会刷新用户权限。对于长时间没有发送请求的客户端，连接器会自动断开连接。这里的「长时间」是由 wait_timeout 参数来决定的，它的默认值为8小时。

2.2 查询缓存

在经过连接器的建立连接、获取用户权限之后，接下来用户可以提交查询语句了。

最先经过的是查询缓存部分，由它的名字也能够猜到，查询缓存的作用就是查询 MySQL 是否执行过客户端提交的查询语句，如果这条 SQL 之前执行过，并且用户对该表有执行该语句的权限，就会直接返回之前执行的结果。

所以在某些时候，多次执行一句 SQL 并不能得到它的平均执行时间，因为查询缓存的关系，后面的执行时间往往比第一次执行要短。

如果你不想使用缓存，可以在每次查询后都用 update 语句更新表，当然这是非常麻烦并且憨的方法。MySQL也提供了相应的配置项—— query_cache_type，你可以在 my.cnf 文件中将 query_cache_type 设置为0以关闭查询缓存。

需要注意的是：

查询缓存部分是以 key-value 形式进行存储的，key 为查询语句，value 是查询结果。当对数据表进行更新时，关于这张表的所有查询缓存都会失效，所以一般来说查询缓存的命中率是很低的。在 MySQL 8.0 的版本中，查询缓存的功能已经被删除。

2.3 分析器

我使用的 MySQL 版本是5.7.21，所以客户端提交的查询语句会走查询缓存，如果没有命中，那么将继续往下走，来到分析器。

分析器会对提交的语句进行词法分析（解析语句）和语法分析（判断语句是否符合 MySQL 的语法规则），所以分析器的作用就是解析 SQL 语句并检查其合法性。

需要注意的是：

MySQL 在检查 SQL 语句合法性时，仅会在最先不符合 MySQL 语法规则的地方提示错误，并不会将 SQL 语句中所有语法错误的地方全部展示。

举个例子：

select * form user_info limit 1;复制代码

上面这句 SQL 有两个错误，第一是 from 拼写错误，第二是不存在 user_info 这张表，在执行之后，MySQL只会提醒一个错误，下面展示了三次执行 SQL 的结果信息。

第一次的执行信息：1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'form user_info limit 1' at line 1, Time: 0.000000s修改为from后第二次的执行信息：1146 - Table 'windfall.user_info' doesn't exist, Time: 0.000000s修改为 user 表后第三次的执行信息：OK, Time: 0.000000s复制代码

2.4 优化器

在校验了 SQL 语句的合法性之后，MySQL 已经知道用户提交的语句是干什么的了，但是在真正执行之前，还需要经过非常“玄学”的优化器。

优化器的作用是为 SQL 语句生成最优的执行计划。

之所以说优化器很“玄学”，是因为它在优化 SQL 语句的过程中可能会生成出乎用户意料之外的执行计划（索引选择、多表关联连接顺序、隐式函数转换等）。当然优化器有时候也会“选错”索引，这与数据量、索引统计信息等因素有关。

需要注意的是：

如果你需要优化一条生产环境的 SQL，请尽量在本地还原与生产环境数据量相同的表，然后根据执行计划进行优化。在写查询语句的时候，一定要考虑到索引的最左匹配原则（关于最左匹配原则的整理在索引篇再写）。

关于 MySQL 优化器的工作流程，可以看看这篇博客：MySQL 优化器原来是这样工作的

MySQL 的执行计划也是一项必须要掌握的技能，这篇博客写得非常详细，值得一读：不会看 Explain执行计划，劝你简历别写熟悉 SQL优化

2.5 执行器

在优化器生成了 MySQL 认为最优的执行计划之后，最后来到了执行器，执行器的作用当然就是执行SQL语句了。

但是在执行之前，先要做权限验证，验证用户对表是否有查询权限。然后再根据表定义的引擎类型，去使用相对应引擎提供的接口来对该表进行条件查询，最后将该表所有满足条件的数据行作为结果集返回客户端，这样整个 SQL 的执行就结束了。

需要注意的是：

在执行器执行 SQL 语句前会做校验：判断用户对表是否具有操作权限。

2.6 存储引擎

MySQL 支持的存储引擎有很多种，比如：InnoDB、MyISAM、Memory 等等。

2.6.1 InnoDB

InnoDB 是当下最常用的的 MySQL 存储引擎，同时也是 MySQL 5.5 之后的默认存储引擎。

InnoDB 支持事务、MVCC（多版本并发控制）、外键、行级锁和自增列。但是 InnoDB 不支持全文索引，同时它占用的数据空间更大。

即构数智人

即构数智人是由即构科技推出的AI虚拟数字人视频创作平台，支持数字人形象定制、短视频创作、数字人直播等。

36 查看详情

2.6.2 MyISAM

MyISAM 是 MySQL 5.1 及之前的默认存储引擎，支持全文索引、压缩、空间函数、表级锁。

MyISAM 的数据以紧密格式存储所以占用空间更小，它拥有较高的插入和查询速度，但是 MyISAM 不支持事务，且崩溃后无法安全恢复。

2.6.3 Memory

Memory 的所有数据都保存的内存中，由于不需要磁盘 I/O，所以它的速度比 MyISAM 和 InnoDB 快了一个数量级。但如果数据库关闭或重启，Memory 引擎的数据就会消失。

Memory 支持 Hash 索引，但由于它使用表级锁，因此并发写入的性能比较低。

值得一提的是，MySQL 中的临时表，一般是用 Memory 表保存的，如果中间表数据量过大或含有 BLOB 类型或 TEXT 类型的字段，就会使用 MyISAM 表。

关于存储引擎，由于本人接触的比较少，等看完《MySQL技术内幕：InnoDB存储引擎》之后再整理，这里只是简单地提一下。

3. 日志模块

前面所说的执行流程主要是描述查询语句，如果是更新语句还涉及到 MySQL 的日志模块。

从客户端到执行器的之间的逻辑查询语句和更新语句是相同的，只是在到执行器这一层的时候，更新语句会和 MySQL 的日志模块产生交互，这是查询语句和更新语句不一样的地方。

3.1 物理日志 redo log

3.1.1 redo log 中记录的内容

对于 InnoDB 存储引擎来说，它有一个特有的日志模块——物理日志（重做日志）redo log，它是 InnoDB 存储引擎的日志，它所记录的是数据页的物理修改。

举个例子，现在有一张 user 表，有一条主键 id=1，age=18 的数据，然后用户提交了下面这条 SQL，执行器准备执行。

update user set age=age+1 where id=1;复制代码

对于这条 SQL，在 redo log 中记录的内容大致是：将 user 表中主键 id=1 行的 age 字段值修改为19。

3.1.2 WAL

MySQL 的更新持久化逻辑运用到了 WAL(Write-Ahead Logging，写前日志记录) 的思想：先写日志，再写磁盘。

需要注意的是这里的写日志也是写到磁盘中，但由于日志是顺序写入的，所以速度很快。而如果没有 redo log，直接更新磁盘中的数据，那么首先需要找到那条记录，然后再把新的值更新进入，由于查询和读写I/O，就相对会慢一些。

最后，当 InnoDB 引擎空闲的时候，它会去执行 redo log 中的逻辑，将数据持久化到磁盘中。

3.1.3 redo log 日志文件

redo log 日志文件大小是固定的，我把它理解为一个循环链表，链表的每个节点都可以存放日志，在这个链表中有两个指针：write（黑）和 read（白）。

最开始这两个指针都指向同一个节点，且节点日志元素都为空，表示此时 redo log 为空。当用户开始提交更新语句，write 节点开始往前移动，假设移动到3的位置。而此时的情况就是 redo log 中有1-3这三个日志元素需要被持久化到磁盘中，当 InnoDB 空闲时，read 指针往前移动，就代表着将 redo log 持久化到磁盘。

但这里有一种特殊情况，就是 InnoDB 一直没有空闲，write 指针一直在写入日志，直到它写到5的位置，再往前写又回到了最开始1的位置（也就是上图的位置，但不同的是链表节点中都存在日志数据）。

此时发现1的位置已经有日志数据了，同时 read 指针也在。那么这时候 write 指针就会暂停写入，InnoDB 引擎开始催动 read 指针移动，把 redo log 清空掉一部分之后再让 write 指针写入日志文件。

3.1.4 redo log 的作用

我们已经知道，redo log 中记录的是数据页的物理修改，所以 redo log 能够保证在数据库发生异常重启时，记录尚未写入磁盘，但是在重启后可以通过 redo log 来“redo”，从而不会发生记录丢失的情况，保证了事务的持久性。

这一能力也被称作 crash-safe。

3.2 归档日志 bin log

前面说到 redo log 是 InnoDB 特有的日志，而 bin log 则是属于 MySQL Server 层的日志，在默认的 Statement Level 下它记录的是更新语句的原始逻辑，即 SQL 本身。

另外需要注意的是：

bin log 的日志文件大小并不固定，它是“追加写入”的模式，写完一个文件后会切换到下一个文件写入。bin log 没有 crash-safe 的能力。bin log 是在事务最终提交前写入的，而 redo log 是在事务执行中不断写入的。

3.2.1 bin log 的作用

与 redo log 不同的是，bin log 常用于恢复数据，比如说主从复制，从节点根据父节点的 bin log 来进行数据同步，实现主从同步。

3.3 两阶段提交

为了让 redo log 和 bin log 的状态保持一致，MySQL 使用两阶段提交的方式来写入 redo log 日志。

在执行器调用 InnoDB 引擎的接口将写入更新数据时，InnoDB 引擎会将本次更新记录到 redo log 中，同时将 redo log 的状态标记为 prepare，表示可以提交事务。

随后执行器生成本次操作的 bin log 数据，并写入 bin log 的日志文件中。

最后执行器调用 InnoDB 的提交事务接口，存储引擎把刚写入的 redo log 记录状态修改为 commit，本次更新结束。

在这个过程中有三个步骤 add redo log and mark as prepare -> add bin log -> commit，即：

写入 redo log 日志并标记为 prepare写入 bin log提交事务

如果在第二个步骤，也就是写入 bin log 之前系统崩溃或重启，启动后由于 bin log 中没有记录，会将 redo log 中的记录回滚至执行本次更新语句前。

如果在第三个步骤前，也就是提交之前系统崩溃或重启，即便没有 commit 但是满足 redo log 中记录为 prepare 状态并且 bin log 中也有完整记录，在重启后会自动 commit，并不会回滚。

4. 小结

本文主要介绍 MySQL 的基础架构以及各个组成部分的功能，最后介绍了 MySQL Server 层的 bin log 和 InnoDB 特有的 redo log 这两种日志模块。

5. 温故知新

以下的几个问题是对本文所描述内容的提问，巩固知识，正所谓“温故而知新，可以为师矣”。

如果查询语句中字段不存在、字段有歧义、关键字拼写错误，是由哪个部分报错？如果用户对表没有查询权限，是哪个部分报错？为什么 MySQL 的查询缓存会无效？一条 select 查询语句是如何执行的？MySQL 常用的存储引擎有哪些？MySQL 的日志模块有哪些？分别起到什么作用？redo log 写满了怎么办？如何理解 redo log 的两阶段提交？

redo log 和 bin log 的区别？

更多相关免费学习推荐：mysql教程(视频)

以上就是我所理解的MySQL之一：基础架构的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/355739.html

mysql

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

高德地图怎么给商户添加标注_高德地图商户标注添加操作教程

上一篇 2025年11月6日 00:31:14

如何在CentOS上监控PyTorch的运行状态

下一篇 2025年11月6日 00:31:31

用户投稿

开源免费PHP工具 PHP开发效率提升利器

推荐开源免费PHP开发工具以提升效率：VS Code、Sublime Text轻量高效，PhpStorm专业强大；调试用Xdebug、Kint、Ray；依赖管理选Composer；代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer；数据库管理可用%ignore_a_1%MyA…

程序猿
2026年5月10日
0000
MySQL数据库不支持中文的解决办法

接上一篇文章，在解决了mysql+flask环境配置问题之后，往数据库存中文字符串会报1366错误，提示不正确的字符。继而发现默认的mysql采用了latin1字符集，这种编码是不支持中文的。如果想支持中文的话，需要设置一下mysql字符集。众所周知utf-8是可以的，gbk也没问题，为了可扩展…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

Go语言连接外部MySQL数据库：DSN配置与常见错误解析

本文详细阐述了go语言使用`go-sql-driver/mysql`驱动连接外部mysql数据库的正确方法。重点介绍了数据源名称（dsn）的规范格式，特别是主机地址部分的配置，以避免常见的“getaddrinfow: the specified class was not found.”等网络解析错…

程序猿
2026年5月10日
0000
用户投稿

后缀php怎么打开_php文件打开方式与运行环境搭建指南

要打开PHP文件需根据用途选择方式：查看代码可用文本编辑器或IDE，运行则需服务器环境。推荐新手使用XAMPP、WAMP等集成环境，将文件放入htdocs目录后访问localhost；开发者可利用PHP内置服务器，命令行执行php -S localhost:8000运行；高级用户可手动配置Apach…

程序猿
2026年5月10日
0000
用户投稿

PHP动态网页数据库备份恢复_PHP动态网页MySQL数据库备份教程

答案：PHP动态网页的MySQL数据库备份与恢复需通过定期导出SQL文件并安全存储来保障数据安全，核心方法包括使用mysqldump命令行工具实现高效灵活的自动化备份，利用phpMyAdmin图形化工具进行手动导出导入以降低操作门槛，以及通过PHP脚本调用系统命令将备份过程集成到应用中；恢复时可采用…

程序猿
2026年5月10日
0000
php登录怎么实现_php用户登录系统完整实现

<blockquote>PHP用户登录系统的核心是安全验证与会话管理。首先创建POST提交的登录表单，避免敏感信息暴露；后端通过session_start()启动会话，使用trim()和htmlspecialchars()清理输入，防止XSS攻击；利用PDO预处理语句查询数据库，防止SQ…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

远程MySQL数据库连接指南：从本地PHP应用访问GCP实例数据库

本文详细指导如何在本地php应用中连接到google cloud platform (gcp) 虚拟机实例上的远程mysql数据库。教程涵盖了数据库连接参数的配置、使用php pdo建立连接的方法、gcp环境下的网络配置要点，以及常见的安全和故障排除建议，旨在帮助开发者顺利实现跨环境的数据库通信。 …

程序猿
2026年5月10日
0000
用户投稿

在PHP中实现MySQL数据插入时避免重复记录的策略

本文将探讨在php应用中向mysql数据库插入数据时，如何有效避免重复记录的产生。针对当主键或唯一索引字段值已存在的情况，我们将介绍使用`insert ignore`语句的策略，以确保数据完整性并防止不必要的重复插入，从而简化数据管理逻辑。引言：数据完整性与重复记录问题在数据库管理中，数据完整性…

程序猿
2026年5月10日
0000
用户投稿

php实现哪些功能

PHP是一种通用脚本语言，可用来实现广泛的功能，包括：动态Web开发：生成响应用户请求的动态 веб页面。内容管理系统（CMS）：构建允许用户管理网站内容的CMS。电子商务：开发具有购物车、订单处理和支付网关集成的电子商务网站。服务器端编程：编写命令行脚本和工具。文件操作：创建、读取、写入和删除文件…

程序猿
2026年5月10日
0000
用户投稿

PHP 动态 SQL WHERE 子句构建：避免重复 AND 的策略

本文探讨了在 php 中动态构建 sql 查询 `where` 子句时常见的“`where and`”语法错误及其解决方案。通过逐步构建条件字符串，确保第一个条件不带 `and`，后续条件正确使用 `and` 连接，从而生成符合 sql 规范的查询语句，提高代码的健壮性和可读性。动态构建 SQL …

程序猿
2026年5月10日
2000
用户投稿

PHP中基于用户角色的页面访问控制实践

本教程详细讲解如何在PHP应用程序中利用会话（Session）机制实现基于用户角色的页面访问控制。通过正确的session_start()调用、用户登录时的角色信息存储，以及在受保护页面进行严格的会话和角色类型检查，确保只有特定用户（如“manager”）才能访问指定页面，从而有效防止未经授权的访问…

程序猿
2026年5月10日
1000
用户投稿

php数据库触发器应用实例_php数据库自动化任务的处理

通过MySQL触发器与PHP结合，可在数据变更时自动记录日志、校验数据及同步状态。首先创建user_log表并定义AFTER INSERT/UPDATE/DELETE触发器，记录users表的操作信息；随后使用PHP的PDO执行增删改操作，验证日志生成；接着创建BEFORE INSERT触发器限制非…

程序猿
2026年5月10日
0000
用户投稿

php数据库数据压缩处理_php数据库存储空间优化方法

可通过启用MySQL行压缩、PHP层数据压缩、优化字段结构及分表归档策略减少存储占用。具体步骤：1. 使用InnoDB压缩表并设置KEY_BLOCK_SIZE；2. PHP中用gzcompress压缩大数据字段，存为BLOB；3. 选用更小数据类型如TINYINT，避免冗余TEXT；4. 将历史数据…

程序猿
2026年5月10日
0000
用户投稿

php数据整理怎么按日期字段分组汇总_php按日期分组统计与时间段合并技巧

可使用SQL或PHP对数据按日期分组汇总。1、通过MySQL的DATE()、YEAR()、MONTH()函数在查询时按日、月、年分组统计；2、在PHP中遍历数组，以date(‘Y-m-d’)等格式化日期作为键进行归类；3、按周可使用date(‘o-W’…

程序猿
2026年5月10日
0000
用户投稿

php数据库如何实现全文搜索 php数据库搜索引擎的构建方法

答案：在PHP项目中实现数据库全文搜索需利用MySQL的FULLTEXT索引功能，通过PDO预处理语句执行MATCH()…AGAINST()查询，结合PHP过滤用户输入以防止SQL注入；为提升体验可引入中文分词、权重排序、结果高亮等优化措施；数据量增长后可迁移至Elasticsearch…

程序猿
2026年5月10日
0000
用户投稿

php调用数据同步方案_php调用多数据库数据同步

首先明确同步需求与模式，如单向、双向、定时或实时同步；接着使用PHP通过PDO连接多数据库，基于时间戳或增量ID同步变更数据，并记录同步状态；为提高可靠性，可引入消息队列、binlog解析、中间同步层及加锁机制；最后注意网络超时、分页处理、错误重试、日志记录与测试验证，确保数据一致性与系统稳定性。 …

程序猿
2026年5月10日
0000
用户投稿

php怎么安装_在云服务器上部署PHP环境的步骤

答案：在云服务器上部署PHP环境需搭建LEMP栈（Linux+Nginx+MySQL+PHP-FPM），依次更新系统、安装Nginx、MariaDB、PHP-FPM及扩展，配置Nginx解析PHP并测试，最后通过权限控制、安全配置、防火墙和HTTPS等措施保障环境安全稳定。在云服务器上部署PHP环…

程序猿
2026年5月10日
0000
用户投稿

使用MySQL和PHP高效获取最热门数据条目：统计与排序实践

本教程详细阐述如何利用mysql的聚合函数和php的mysqli扩展，高效地从数据库中查询并排序出最常出现的数据条目。文章将通过一个具体的案例，指导读者构建正确的sql查询，并结合php进行数据处理和调试，避免常见的sql语法错误和php运行时问题，从而准确获取按频率降序排列的热门数据。在Web开…

程序猿
2026年5月10日
0000
用户投稿

SQL查询：精确判断事件过期，结合日期与时间列

本文旨在解决数据库中事件过期判断不精确的问题，特别是当事件的过期日期和时间分别存储在不同列时。我们将探讨两种主流的sql查询策略：一种是利用逻辑运算符`or`和`and`进行分情况判断，另一种是通过合并日期和时间列为单一时间戳进行直接比较。文章将详细阐述每种方法的实现方式、适用场景及相关注意事项，确…

程序猿
2026年5月10日
1000
用户投稿

HTML表单如何实现白名单功能？怎样只允许授权用户？

要实现%ignore_a_1%的白名单功能并确保只有授权用户操作，核心答案是必须依赖后端服务器进行严格的身份认证、会话管理、授权检查和数据验证，前端仅能提供用户体验层面的初步提示而不能保障安全；具体而言，首先通过用户身份认证（如用户名/密码或oauth）确认用户身份，服务器创建会话并返回标识符，后续…

程序猿
2026年5月10日
8000