图文详解mysql架构原理

程序猿 • 2025年11月1日 04:52:55 • 用户投稿 • 阅读 0

本篇文章给大家带来了关于mysql的相关知识，其中主要介绍了关于架构原理的相关内容，mysql server架构自顶向下大致可以分网络连接层、服务层、存储引擎层和系统文件层，下面一起来看一下，希望对大家有帮助。

推荐学习：mysql视频教程

Mysql 架构原理

1、Mysql体系架构

MySQL Server架构自顶向下大致可以分网络连接层、服务层、存储引擎层和系统文件层。

网络连接层

客户端连接器（Client Connectors）：提供与MySQL服务器建立的支持。目前几乎支持所有主流的服务端编程技术，例如常见的 Java、C、Python、.NET等，它们通过各自API技术与MySQL建立连接。

服务层（MySQL Server）

服务层是MySQL Server的核心，主要包含系统管理和控制工具、连接池、SQL接口、解析器、查询优化器和缓存六个部分。

连接池（Connection Pool）：负责存储和管理客户端与数据库的连接，一个线程负责管理一个连接。

系统管理和控制工具（Management Services & Utilities）：例如备份恢复、安全管理、集群管理等

SQL接口（SQL Interface）：用于接受客户端发送的各种SQL命令，并且返回用户需要查询的结果。比如DML、DDL、存储过程、视图、触发器等。

解析器（Parser）：负责将请求的SQL解析生成一个”解析树”。然后根据一些MySQL规则进一步检查解析树是否合法。

查询优化器（Optimizer）：当”解析树”通过解析器语法检查后，将交由优化器将其转化成执行计划，然后与存储引擎交互。

select uid, name from user where gender = 1;选取 –》投影 –》联接策略select先根据where语句进行选取，并不是查询出全部数据再过滤；select查询根据uid和name进行属性投影，并不是取出所有字段；将前面选取和投影联接起来最终生成查询结果；

缓存（Cache&Buffer）：缓存机制是由一系列小缓存组成的。比如表缓存，记录缓存，权限缓存，引擎缓存等。如果查询缓存有命中的查询结果，查询语句就可以直接去查询缓存中取数据。

存储引擎层（Pluggable Storage Engines）

存储引擎负责MySQL中数据的存储与提取，与底层系统文件进行交互。MySQL存储引擎是插件式的，服务器中的查询执行引擎通过接口与存储引擎进行通信，接口屏蔽了不同存储引擎之间的差异。现在有很多种存储引擎，各有各的特点，最常见的是MyISAM和InnoDB。

系统文件层（File System）

该层负责将数据库的数据和日志存储在文件系统之上，并完成与存储引擎的交互，是文件的物理存储层。主要包含日志文件，数据文件，配置文件，pid 文件，socket 文件等。

日志文件错误日志（Error log）默认开启，show variables like ‘%log_error%’;通用查询日志（General query log）记录一般查询语句，show variables like ‘%general%’;二进制日志（binary log）记录了对MySQL数据库执行的更改操作，并且记录了语句的发生时间、执行时长；但是它不记录select、show等不修改数据库的SQL。主要用于数据库恢复和主从复制。show variables like ‘%log_bin%’; //是否开启show variables like ‘%binlog%’; //参数查看show binary logs;//查看日志文件慢查询日志（Slow query log）记录所有执行时间超时的查询SQL，默认是10秒。show variables like ‘%slow_query%’; //是否开启show variables like ‘%long_query_time%’; //时长配置文件用于存放MySQL所有的配置信息文件，比如my.cnf、my.ini等。数据文件db.opt 文件：记录这个库的默认使用的字符集和校验规则。frm 文件：存储与表相关的元数据（meta）信息，包括表结构的定义信息等，每一张表都会有一个frm 文件。MYD 文件：MyISAM 存储引擎专用，存放 MyISAM 表的数据（data)，每一张表都会有一个.MYD 文件。MYI 文件：MyISAM 存储引擎专用，存放 MyISAM 表的索引相关信息，每一张 MyISAM 表对应一个 .MYI文件。ibd文件和 IBDATA 文件：存放 InnoDB 的数据文件（包括索引）。InnoDB 存储引擎有两种表空间方式：独享表空间和共享表空间。独享表空间使用 .ibd 文件来存放数据，且每一张InnoDB 表对应一个 .ibd 文件。共享表空间使用 .ibdata 文件，所有表共同使用一个（或多个，自行配置）.ibdata 文件。ibdata1 文件：系统表空间数据文件，存储表元数据、Undo日志等。ib_logfile0、ib_logfile1 文件：Redo log 日志文件。pid 文件pid 文件是 mysqld 应用程序在 Unix/Linux 环境下的一个进程文件，和许多其他 Unix/Linux 服务端程序一样，它存放着自己的进程 id。socket 文件socket 文件也是在 Unix/Linux 环境下才有的，用户在 Unix/Linux 环境下客户端连接可以不通过TCP/IP 网络而直接使用 Unix Socket 来连接 MySQL。

2、MySQL运行机制

建立连接（Connectors&Connection Pool），通过客户端/服务器通信协议与MySQL建立连接。MySQL 客户端与服务端的通信方式是 “ 半双工 ”。对于每一个 MySQL 的连接，时刻都有一个线程状态来标识这个连接正在做什么。通讯机制：全双工：能同时发送和接收数据，例如平时打电话。半双工：指的某一时刻，要么发送数据，要么接收数据，不能同时。例如早期对讲机单工：只能发送数据或只能接收数据。例如单行道；线程状态：show processlist; //查看用户正在运行的线程信息，root用户能查看所有线程，其他用户只能看自己的；id：线程ID，可以使用kill xx；user：启动这个线程的用户Host：发送请求的客户端的IP和端口号db：当前命令在哪个库执行Command：该线程正在执行的操作命令Create DB：正在创建库操作Drop DB：正在删除库操作Execute：正在执行一个PreparedStatementClose Stmt：正在关闭一个PreparedStatementQuery：正在执行一个语句Sleep：正在等待客户端发送语句Quit：正在退出Shutdown：正在关闭服务器Time：表示该线程处于当前状态的时间，单位是秒State：线程状态Updating：正在搜索匹配记录，进行修改Sleeping：正在等待客户端发送新请求Starting：正在执行请求处理Checking table：正在检查数据表Closing table : 正在将表中数据刷新到磁盘中Locked：被其他查询锁住了记录Sending Data：正在处理Select查询，同时将结果发送给客户端Info：一般记录线程执行的语句，默认显示前100个字符。想查看完整的使用show full processlist;查询缓存（Cache&Buffer），这是MySQL的一个可优化查询的地方，如果开启了查询缓存且在查询缓存过程中查询到完全相同的SQL语句，则将查询结果直接返回给客户端；如果没有开启查询缓存或者没有查询到完全相同的 SQL 语句则会由解析器进行语法语义解析，并生成“解析树”。缓存Select查询的结果和SQL语句；执行Select查询时，先查询缓存，判断是否存在可用的记录集，要求是否完全相同（包括参数值），这样才会匹配缓存数据命中；即使开启查询缓存，以下SQL也不能缓存：查询语句使用SQL_NO_CACHE查询的结果大于query_cache_limit设置查询中有一些不确定的参数，比如now()show variables like ‘%query_cache%’; //查看查询缓存是否启用，空间大小，限制等show status like ‘Qcache%’; //查看更详细的缓存参数，可用缓存空间，缓存块，缓存多少等解析器（Parser）将客户端发送的SQL进行语法解析，生成”解析树”。预处理器根据一些MySQL规则进一步检查“解析树”是否合法，例如这里将检查数据表和数据列是否存在，还会解析名字和别名，看看它们是否有歧义，最后生成新的“解析树”。查询优化器（Optimizer）根据“解析树”生成最优的执行计划。MySQL使用很多优化策略生成最优的执行计划，可以分为两类：静态优化（编译时优化）、动态优化（运行时优化）。等价变换策略5=5 and a>5 改成 a > 5a 5 and a=5基于联合索引，调整条件位置等优化count、min、max等函数InnoDB引擎min函数只需要找索引最左边InnoDB引擎max函数只需要找索引最右边MyISAM引擎count(*)，不需要计算，直接返回提前终止查询使用了limit查询，获取limit所需的数据，就不在继续遍历后面数据in的优化MySQL对 in 查询，会先进行排序，再采用二分法查找数据。比如where id in (2,1,3)，变成 in (1,2,3)；查询执行引擎负责执行 SQL 语句，此时查询执行引擎会根据 SQL 语句中表的存储引擎类型，以及对应的API接口与底层存储引擎缓存或者物理文件的交互，得到查询结果并返回给客户端。若开启用查询缓存，这时会将SQL 语句和结果完整地保存到查询缓存（Cache&Buffffer）中，以后若有相同的 SQL 语句执行则直接返回结果。如果开启了查询缓存，先将查询结果做缓存操作返回结果过多，采用增量模式返回开始执行的时候，要先判断一下你对这个表 T 有没有执行查询的权限，如果没有，就会返回没有权限的错误，（如果命中查询缓存，会在查询缓存返回结果的时候，做权限验证。查询也会在优化器之前调用 precheck 验证权限）。如果有权限，就打开表继续执行。打开表的时候，执行器就会根据表的引擎定义，去使用这个引擎提供的接口。执行器的执行流程是这样的：select * from test where age > 10;调用 InnoDB 引擎接口取这个表的第一行，判断 age 值是不是 10，如果不是则跳过，如果是则将这行存在结果集中；调用引擎接口取“下一行”，重复相同的判断逻辑，直到取到这个表的最后一行。执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。

3、Mysql存储引擎

存储引擎在MySQL的体系架构中位于第三层，负责MySQL中的数据的存储和提取，是与文件打交道的子系统，它是根据MySQL提供的文件访问层抽象接口定制的一种文件访问机制，这种机制就叫作存储引擎。

使用show engines命令，就可以查看当前数据库支持的引擎信息。

在5.5版本之前默认采用MyISAM存储引擎，从5.5开始采用InnoDB存储引擎。

InnoDB：支持事务，具有提交，回滚和崩溃恢复能力，事务安全；MyISAM：不支持事务和外键，访问速度快；Memory：利用内存创建表，访问速度非常快，因为数据在内存，而且默认使用Hash索引，但是一旦关闭，数据就会丢失；Archive：归档类型引擎，仅能支持insert和select语句；Csv：以CSV文件进行数据存储，由于文件限制，所有列必须强制指定not null，另外CSV引擎也不支持索引和分区，适合做数据交换的中间表；BlackHole: 黑洞，只进不出，进来消失，所有插入数据都不会保存；Federated：可以访问远端MySQL数据库中的表。一个本地表，不保存数据，访问远程表内容。MRG_MyISAM：一组MyISAM表的组合，这些MyISAM表必须结构相同，Merge表本身没有数据，对Merge操作可以对一组MyISAM表进行操作；

InnoDB和MyISAM对比

事务和外键InnoDB支持事务和外键，具有安全性和完整性，适合大量insert或update操作MyISAM不支持事务和外键，它提供高速存储和检索，适合大量的select查询操作锁机制InnoDB支持行级锁，锁定指定记录。基于索引来加锁实现。MyISAM支持表级锁，锁定整张表。索引结构InnoDB使用聚集索引（聚簇索引），索引和记录在一起存储，既缓存索引，也缓存记录。MyISAM使用非聚集索引（非聚簇索引），索引和记录分开。并发处理能力MyISAM使用表锁，会导致写操作并发率低，读之间并不阻塞，读写阻塞。InnoDB读写阻塞可以与隔离级别有关，可以采用多版本并发控制（MVCC）来支持高并发存储文件InnoDB表对应两个文件，一个.frm表结构文件，一个.ibd数据文件。InnoDB表最大支持64TB；MyISAM表对应三个文件，一个.frm表结构文件，一个MYD表数据文件，一个.MYI索引文件。从
MySQL5.0开始默认限制是256TB。适用场景MyISAM不需要事务支持（不支持）并发相对较低（锁定机制问题）数据修改相对较少，以读为主数据一致性要求不高InnoDB需要事务支持（具有较好的事务特性）行级锁定对高并发有很好的适应能力数据更新较为频繁的场景数据一致性要求较高硬件设备内存较大，可以利用InnoDB较好的缓存能力来提高内存利用率，减少磁盘IO总结两种引擎该如何选择？是否需要事务？有，InnoDB是否存在并发修改？有，InnoDB是否追求快速查询，且数据修改少？是，MyISAM在绝大多数情况下，推荐使用InnoDB

InnoDB存储结构

从MySQL 5.5版本开始默认使用InnoDB作为引擎，它擅长处理事务，具有自动崩溃恢复的特性。下面是官方的InnoDB引擎架构图，主要分为内存结构和磁盘结构两大部分。

InnoDB内存结构

内存结构主要包括Buffer Pool、Change Buffer、Adaptive Hash Index和Log Buffer四大组件。

Buffer Pool：缓冲池，简称BP。BP以Page页为单位，默认大小16K，BP的底层采用链表数据结构管理Page。在InnoDB访问表记录和索引时会在Page页中缓存，以后使用可以减少磁盘IO操作，提升效率。Page管理机制Page根据状态可以分为三种类型：free page ：空闲page，未被使用clean page：被使用page，数据没有被修改过dirty page：脏页，被使用page，数据被修改过，页中数据和磁盘的数据产生了不一致针对上述三种page类型，InnoDB通过三种链表结构来维护和管理：free list ：表示空闲缓冲区，管理free pageflush list：表示需要刷新到磁盘的缓冲区，管理dirty page，内部page按修改时间排序。脏页即存在于flush链表，也在LRU链表中，但是两种互不影响，LRU链表负责管理page的可用性和放，而flush链表负责管理脏页的刷盘操作。lru list：表示正在使用的缓冲区，管理clean page和dirty page，缓冲区以midpoint为基点，前面链表称为new列表区，存放经常访问的数据，占63%；后面的链表称为old列表区，存放使用较少数据，占37%。改进型LRU算法维护 普通LRU：末尾淘汰法，新数据从链表头部加入，释放空间时从末尾淘汰改性LRU：链表分为new和old两个部分，加入元素时并不是从表头插入，而是从中间midpoint位置插入，如果数据很快被访问，那么page就会向new列表头部移动，如果数据没有被访问，会逐步向old尾部移动，等待淘汰。每当有新的page数据读取到buffer pool时，InnoDb引擎会判断是否有空闲页，是否足够，如果有就将free page从free list列表删除，放入到LRU列表中。没有空闲页，就会根据LRU算法淘汰LRU链表默认的页，将内存空间释放分配给新的页。Buffer Pool配置参数show variables like ‘%innodb_page_size%’; //查看page页大小show variables like ‘%innodb_old%’; //查看lru list中old列表参数show variables like ‘%innodb_buffer%’; //查看buffffer pool参数建议：将innodb_buffer_pool_size设置为总内存大小的60%-80%，innodb_buffer_pool_instances可以设置为多个，这样可以避免缓存争夺。Change Buffer：写缓冲区，简称CB。在进行DML操作时，如果BP没有其相应的Page数据，并不会立刻将磁盘页加载到缓冲池，而是在CB记录缓冲变更，等未来数据被读取时，再将数据合并恢复到BP中。ChangeBuffer占用BufferPool空间，默认占25%，最大允许占50%，可以根据读写业务量来进行调整。参数innodb_change_buffer_max_size;当更新一条记录时，该记录在BufferPool存在，直接在BufferPool修改，一次内存操作。如果该记录在BufferPool不存在（没有命中），会直接在ChangeBuffer进行一次内存操作，不用再去磁盘查询数据，避免一次磁盘IO。当下次查询记录时，会先进性磁盘读取，然后再从ChangeBuffer中读取信息合并，最终载入BufferPool中。写缓冲区，仅适用于非唯一普通索引页如果在索引设置唯一性，在进行修改时，InnoDB必须要做唯一性校验，因此必须查询磁盘，做一次IO操作。会直接将记录查询到BufferPool中，然后在缓冲池修改，不会在ChangeBuffer操作。Adaptive Hash Index：自适应哈希索引，用于优化对BP数据的查询。InnoDB存储引擎会监控对表索引的查找，如果观察到建立哈希索引可以带来速度的提升，则建立哈希索引，所以称之为自适应。InnoDB存储引擎会自动根据访问的频率和模式来为某些页建立哈希索引。Log Buffer：日志缓冲区，用来保存要写入磁盘上log文件（Redo/Undo）的数据，日志缓冲区的内容定期刷新到磁盘log文件中。日志缓冲区满时会自动将其刷新到磁盘，当遇到BLOB或多行更新的大事务操作时，增加日志缓冲区可以节省磁盘I/O。LogBuffer主要是用于记录InnoDB引擎日志，在DML操作时会产生Redo和Undo日志；LogBuffer空间满了，会自动写入磁盘。可以通过将innodb_log_buffer_size参数调大，减少磁盘IO频率；innodb_flush_log_at_trx_commit参数控制日志刷新行为，默认为10 ：每隔1秒写日志文件和刷盘操作（写日志文件LogBuffer –> OS cache，刷盘OScache –> 磁盘文件），最多丢失1秒数据1：事务提交，立刻写日志文件和刷盘，数据不丢失，但是会频繁IO操作2：事务提交，立刻写日志文件，每隔1秒钟进行刷盘操作

InnoDB磁盘结构

InnoDB磁盘主要包含Tablespaces，InnoDB Data Dictionary，Doublewrite Buffer、Redo Log和Undo Logs。

表空间（Tablespaces）：用于存储表结构和数据。表空间又分为系统表空间、独立表空间、通用表空间、临时表空间、Undo表空间等多种类型；

系统表空间（The System Tablespace）

包含InnoDB数据字典，Doublewrite Buffer，Change Buffer，Undo Logs的存储区域。系统表空间也默认包含任何用户在系统表空间创建的表数据和索引数据。系统表空间是一个共享的表空间因为它是被多个表共享的。该空间的数据文件通过参数innodb_data_file_path控制，默认值是ibdata1:12M:autoextend(文件名为ibdata1、12MB、自动扩展)。

CREATE TABLESPACE ts1 ADD DATAFILE ts1.ibd Engine=InnoDB; //创建表空间ts1 CREATE TABLE t1 (c1 INT PRIMARY KEY) TABLESPACE ts1; //将表添加到ts1 表空间

独立表空间（File-Per-Table Tablespaces）

默认开启，独立表空间是一个单表表空间，该表创建于自己的数据文件中，而非创建于系统表空间中。当innodb_file_per_table选项开启时，表将被创建于表空间中。否则，innodb将被创建于系统表空间中。每个表文件表空间由一个.ibd数据文件代表，该文件默认被创建于数据库目录中。表空间的表文件支持动态（dynamic）和压缩（commpressed）行格式。

通用表空间（General Tablespaces）

通用表空间为通过create tablespace语法创建的共享表空间。通用表空间可以创建于mysql数据目录外的其他表空间，其可以容纳多张表，且其支持所有的行格式。

撤销表空间（Undo Tablespaces）

撤销表空间由一个或多个包含Undo日志文件组成。在MySQL 5.7版本之前Undo占用的是System Tablespace共享区，从5.7开始将Undo从System Tablespace分离了出来。InnoDB使用的undo表空间由innodb_undo_tablespaces配置选项控制，默认为0。参数值为0表示使用系统表空间ibdata1;大于0表示使用undo表空间undo_001、undo_002等。

临时表空间（Temporary Tablespaces）

分为session temporary tablespaces 和global temporary tablespace两种：session temporary tablespaces 存储的是用户创建的临时表和磁盘内部的临时表。global temporary tablespace储存用户临时表的回滚段（rollback segments ）。mysql服务器正常关闭或异常终止时，临时表空间将被移除，每次启动时会被重新创建。

数据字典（InnoDB Data Dictionary）

InnoDB数据字典由内部系统表组成，这些表包含用于查找表、索引和表字段等对象的元数据。元数据物理上位于InnoDB系统表空间中。由于历史原因，数据字典元数据在一定程度上与InnoDB表元数据文件（.frm文件）中存储的信息重叠。

双写缓冲区（Doublewrite Buffer）

位于系统表空间，是一个存储区域。在BufferPage的page页刷新到磁盘真正的位置前，会先将数据存在Doublewrite 缓冲区。如果在page页写入过程中出现操作系统、存储子系统或mysqld进程崩溃，InnoDB可以在崩溃恢复期间从Doublewrite 缓冲区中找到页面的一个好备份。在大多数情况下，默认情况下启用双写缓冲区，要禁用Doublewrite 缓冲区，可以将innodb_doublewrite设置为0。使用Doublewrite 缓冲区时建议将innodb_flush_method设置为O_DIRECT。MySQL的innodb_flush_method这个参数控制着innodb数据文件及redo log的打开、刷写模式。有三个值：fdatasync(默认)，O_DSYNC，O_DIRECT。设置O_DIRECT表示数据文件写入操作会通知操作系统不要缓存数据，也不要用预读，直接从InnodbBuffer写到磁盘文件。默认的fdatasync意思是先写入操作系统缓存，然后再调用fsync()函数去异步刷数据文件与redo log的缓存信息。

重做日志（Redo Log）

重做日志是一种基于磁盘的数据结构，用于在崩溃恢复期间更正不完整事务写入的数据。MySQL以循环方式写入重做日志文件，记录InnoDB中所有对Buffer Pool修改的日志。当出现实例故障（像断电），导致数据未能更新到数据文件，则数据库重启时须redo，重新把数据更新到数据文件。读写事务在执行的过程中，都会不断的产生redo log。默认情况下，重做日志在磁盘上由两个名为ib_logfile0和ib_logfile1的文件物理表示。

撤销日志（Undo Logs）

撤消日志是在事务开始之前保存的被修改数据的备份，用于例外情况时回滚事务。撤消日志属于逻辑日志，根据每行记录进行记录。撤消日志存在于系统表空间、撤消表空间和临时表空间中。

新版本结构演变

MySQL 5.7 版本将 Undo日志表空间从共享表空间 ibdata 文件中分离出来，可以在安装 MySQL 时由用户自行指定文件大小和数量。增加了 temporary 临时表空间，里面存储着临时表或临时查询结果集的数据。Buffer Pool 大小可以动态修改，无需重启数据库实例。MySQL 8.0 版本将InnoDB表的数据字典和Undo都从共享表空间ibdata中彻底分离出来了，以前需要ibdata中数据字典与独立表空间ibd文件中数据字典一致才行，8.0版本就不需要了。temporary 临时表空间也可以配置多个物理文件，而且均为 InnoDB 存储引擎并能创建索引，这样加快了处理的速度。用户可以像 Oracle 数据库那样设置一些表空间，每个表空间对应多个物理文件，每个表空间可以给多个表使用，但一个表只能存储在一个表空间中。将Doublewrite Buffer从共享表空间ibdata中也分离出来了。

InnoDB线程模型

IO Thread在InnoDB中使用了大量的AIO（Async IO）来做读写处理，这样可以极大提高数据库的性能。在
InnoDB共有10个IO Thread，分别是4个write，4个read，1个insert buffer和 1个log thread。read thread ：负责读取操作，将数据从磁盘加载到缓存page页。4个write thread：负责写操作，将缓存脏页刷新到磁盘。4个log thread：负责将日志缓冲区内容刷新到磁盘。1个insert buffer thread ：负责将写缓冲内容刷新到磁盘。1个Purge Thread事务提交之后，其使用的undo日志将不再需要，因此需要Purge Thread回收已经分配的undo页。show variables like ‘%innodb_purge_threads%’;Page Cleaner Thread作用是将脏数据刷新到磁盘，脏数据刷盘后相应的redo log也就可以覆盖，即可以同步数据，又能
达到redo log循环使用的目的。会调用write thread线程处理。show variables like ‘%innodb_page_cleaners%’;Master ThreadMaster thread是InnoDB的主线程，负责调度其他各线程，优先级最高。作用是将缓冲池中的数据异步刷新到磁盘，保证数据的一致性。包含：脏页的刷新（page cleaner thread）、undo页回收（purge thread）、redo日志刷新（log thread）、合并写缓冲等。内部有两个主处理，分别是每隔1秒和10秒处理。每1秒的操作：刷新日志缓冲区，刷到磁盘合并写缓冲区数据，根据IO读写压力来决定是否操作刷新脏页数据到磁盘，根据脏页比例达到75%才操作（innodb_max_dirty_pages_pct，
innodb_io_capacity）每10秒的操作：刷新脏页数据到磁盘合并写缓冲区数据刷新日志缓冲区删除无用的undo页

InnoDB数据文件

InnoDB文件存储结构

InnoDB数据文件存储结构

分为 ibd数据文件 –> Segment（段）–>Extent（区）–> Page（页）–>Row（行） Tablesapce表空间，用于存储多个ibd数据文件，用于存储表的记录和索引。一个文件包含多个段。Segment段，用于管理多个Extent，分为数据段（Leaf node segment）、索引段（Non-leaf node
segment）、回滚段（Rollback segment）。一个表至少会有两个segment，一个管理数据，一个管理索引。每多创建一个索引，会多两个segment。Extent区，一个区固定包含64个连续的页，大小为1M。当表空间不足，需要分配新的页资源，不会
一页一页分，直接分配一个区。Page页，用于存储多个Row行记录，大小为16K。包含很多种页类型，比如数据页，undo页，系统页，事务数据页，大的BLOB对象页。Row行，包含了记录的字段值，事务ID（Trx id）、滚动指针（Roll pointer）、字段指针（Field
pointers）等信息。

Page是文件最基本的单位，无论何种类型的page，都是由page header，page trailer和page body组成。如下图所示

InnoDB文件存储格式

通过 SHOW TABLE STATUS 命令查看

一般情况下，如果row_format为REDUNDANT、COMPACT，文件格式为Antelope；如果row_format为DYNAMIC和COMPRESSED，文件格式为Barracuda。

通过 information_schema 查看指定表的文件格式

select * from information_schema.innodb_sys_tables;

File文件格式（File-Format）

在早期的InnoDB版本中，文件格式只有一种，随着InnoDB引擎的发展，出现了新文件格式，用于支持新的功能。目前InnoDB只支持两种文件格式：Antelope 和 Barracuda。Antelope: 先前未命名的，最原始的InnoDB文件格式，它支持两种行格式：COMPACT和REDUNDANT，MySQL 5.6及其以前版本默认格式为Antelope。Barracuda: 新的文件格式。它支持InnoDB的所有行格式，包括新的行格式：COMPRESSED和 DYNAMIC。通过innodb_file_format 配置参数可以设置InnoDB文件格式，之前默认值为Antelope，5.7版本开始改为Barracuda。

Row行格式（Row_format）

表的行格式决定了它的行是如何物理存储的，这反过来又会影响查询和DML操作的性能。如果在单个page页中容纳更多行，查询和索引查找可以更快地工作，缓冲池中所需的内存更少，写入更新时所需的I/O更少。

InnoDB存储引擎支持四种行格式：REDUNDANT、COMPACT、DYNAMIC和COMPRESSED。

DYNAMIC和COMPRESSED新格式引入的功能有：数据压缩、增强型长列数据的页外存储和大索引前缀。

每个表的数据分成若干页来存储，每个页中采用B树结构存储；

如果某些字段信息过长，无法存储在B树节点中，这时候会被单独分配空间，此时被称为溢出页，该字段被称为页外列。

REDUNDANT 行格式使用REDUNDANT行格式，表会将变长列值的前768字节存储在B树节点的索引记录中，其余
的存储在溢出页上。对于大于等于786字节的固定长度字段InnoDB会转换为变长字段，以便
能够在页外存储。COMPACT 行格式与REDUNDANT行格式相比，COMPACT行格式减少了约20%的行存储空间，但代价是增加了
某些操作的CPU使用量。如果系统负载是受缓存命中率和磁盘速度限制，那么COMPACT格式
可能更快。如果系统负载受到CPU速度的限制，那么COMPACT格式可能会慢一些。DYNAMIC 行格式使用DYNAMIC行格式，InnoDB会将表中长可变长度的列值完全存储在页外，而索引记录只包含指向溢出页的20字节指针。大于或等于768字节的固定长度字段编码为可变长度字段。DYNAMIC行格式支持大索引前缀，最多可以为3072字节，可通过innodb_large_prefix参数控制。COMPRESSED 行格式COMPRESSED行格式提供与DYNAMIC行格式相同的存储特性和功能，但增加了对表和索引
数据压缩的支持。

在创建表和索引时，文件格式都被用于每个InnoDB表数据文件（其名称与*.ibd匹配）。修改文件格式的方法是重新创建表及其索引，最简单方法是对要修改的每个表使用以下命令：

ALTER TABLE 表名 ROW_FORMAT=格式类型;

Undo Log

Undo Log介绍

Undo：意为撤销或取消，以撤销操作为目的，返回指定某个状态的操作。

Undo Log：数据库事务开始之前，会将要修改的记录存放到 Undo 日志里，当事务回滚时或者数据库崩溃时，可以利用 Undo 日志，撤销未提交事务对数据库产生的影响。

Undo Log产生和销毁：Undo Log在事务开始前产生；事务在提交时，并不会立刻删除undo log，innodb会将该事务对应的undo log放入到删除列表中，后面会通过后台线程purge thread进行回收处理。Undo Log属于逻辑日志，记录一个变化过程。例如执行一个delete，undolog会记录一个insert；执行一个update，undolog会记录一个相反的update。

Undo Log存储：undo log采用段的方式管理和记录。在innodb数据文件中包含一种rollback segment回滚段，内部包含1024个undo log segment。可以通过下面一组参数来控制Undo log存储。

#相关参数命令show variables like '%innodb_undo%';

Undo Log作用

实现事务的原子性Undo Log 是为了实现事务的原子性而出现的产物。事务处理过程中，如果出现了错误或者用户执行了 ROLLBACK 语句，MySQL 可以利用 Undo Log 中的备份将数据恢复到事务开始之前的状态。

实现多版本并发控制（MVCC）

Undo Log 在 MySQL InnoDB 存储引擎中用来实现多版本并发控制。事务未提交之前，Undo Log保存了未提交之前的版本数据，Undo Log 中的数据可作为数据旧版本快照供其他并发事务进行快照读。

事务A手动开启事务，执行更新操作，首先会把更新命中的数据备份到 Undo Buffer 中；

事务B手动开启事务，执行查询操作，会读取 Undo 日志数据返回，进行快照读；

Redo Log 和 Binlog

Redo Log 日志

Redo Log 介绍

Redo：顾名思义就是重做。以恢复操作为目的，在数据库发生意外时重现操作。Redo Log：指事务中修改的任何数据，将最新的数据备份存储的位置（Redo Log），被称为重做日志。Redo Log 的生成和释放：随着事务操作的执行，就会生成Redo Log，在事务提交时会将产生Redo Log写入Log Buffer，并不是随着事务的提交就立刻写入磁盘文件。等事务操作的脏页写入到磁盘之后，Redo Log 的使命也就完成了，Redo Log占用的空间就可以重用（被覆盖写入）。

Redo Log工作原理

Redo Log 是为了实现事务的持久性而出现的产物。防止在发生故障的时间点，尚有脏页未写入表
的 IBD 文件中，在重启 MySQL 服务的时候，根据 Redo Log 进行重做，从而达到事务的未入磁盘
数据进行持久化这一特性。

Redo Log写入机制

Redo Log 文件内容是以顺序循环的方式写入文件，写满时则回溯到第一个文件，进行覆盖写。

write pos 是当前记录的位置，一边写一边后移，写到最后一个文件末尾后就回到 0 号文件开头；checkpoint 是当前要擦除的位置，也是往后推移并且循环的，擦除记录前要把记录更新到数据文件；write pos 和 checkpoint 之间还空着的部分，可以用来记录新的操作。如果 write pos 追上checkpoint，表示写满，这时候不能再执行新的更新，得停下来先擦掉一些记录，把 checkpoint推进一下。

Redo Log相关配置参数

每个InnoDB存储引擎至少有1个重做日志文件组（group），每个文件组至少有2个重做日志文件，默认为ib_logfile0和ib_logfile1。可以通过下面一组参数控制Redo Log存储：

show variables like '%innodb_log%';

Redo Buffer 持久化到 Redo Log 的策略，可通过 Innodb_flush_log_at_trx_commit 设置：

0：每秒提交 Redo buffer ->OS cache -> flush cache to disk，可能丢失一秒内的事务数据。由后台Master线程每隔 1秒执行一次操作。1（默认值）：每次事务提交执行 Redo Buffer -> OS cache -> flush cache to disk，最安全，性能最差的方式。2：每次事务提交执行 Redo Buffer -> OS cache，然后由后台Master线程再每隔1秒执行OS cache -> flush cache to disk 的操作。一般建议选择取值2，因为 MySQL 挂了数据没有损失，整个服务器挂了才会损失1秒的事务提交数
据。

Binlog日志

Binlog 记录模式

Redo Log 是属于InnoDB引擎所特有的日志，而MySQL Server也有自己的日志，即 Binary log（二进制日志），简称Binlog。Binlog是记录所有数据库表结构变更以及表数据修改的二进制日志，不会记录SELECT和SHOW这类操作。Binlog日志是以事件形式记录，还包含语句所执行的消耗时间。开启Binlog日志有以下两个最重要的使用场景。主从复制：在主库中开启Binlog功能，这样主库就可以把Binlog传递给从库，从库拿到Binlog后实现数据恢复达到主从数据一致性。数据恢复：通过mysqlbinlog工具来恢复数据。Binlog文件名默认为“主机名_binlog-序列号”格式，例如oak_binlog-000001，也可以在配置文件中指定名称。文件记录模式有STATEMENT、ROW和MIXED三种，具体含义如下。ROW（row-based replication, RBR）：日志中会记录每一行数据被修改的情况，然后在slave端对相同的数据进行修改。优点：能清楚记录每一个行数据的修改细节，能完全实现主从数据同步和数据的恢复。缺点：批量操作，会产生大量的日志，尤其是alter table会让日志暴涨。STATMENT（statement-based replication, SBR）：每一条被修改数据的SQL都会记录到master的Binlog中，slave在复制的时候SQL进程会解析成和原来master端执行过的相同的SQL再次执行。简称SQL语句复制。优点：日志量小，减少磁盘IO，提升存储和恢复速度缺点：在某些情况下会导致主从数据不一致，比如last_insert_id()、now()等函数。MIXED（mixed-based replication, MBR）：以上两种模式的混合使用，一般会使用STATEMENT模式保存binlog，对于STATEMENT模式无法复制的操作使用ROW模式保存binlog，MySQL会根据执行的SQL语句选择写入模式。

Binlog 文件结构

MySQL的binlog文件中记录的是对数据库的各种修改操作，用来表示修改操作的数据结构是Log event。不同的修改操作对应的不同的log event。比较常用的log event有：Query event、Row event、Xid event等。binlog文件的内容就是各种Log event的集合。

Binlog文件中Log event结构如下图所示：

Binlog写入机制

根据记录模式和操作触发event事件生成log event（事件触发执行机制）将事务执行过程中产生log event写入缓冲区，每个事务线程都有一个缓冲区Log Event保存在一个binlog_cache_mngr数据结构中，在该结构中有两个缓冲区，一个是stmt_cache，用于存放不支持事务的信息；另一个是trx_cache，用于存放支持事务的信息。事务在提交阶段会将产生的log event写入到外部binlog文件中。不同事务以串行方式将log event写入binlog文件中，所以一个事务包含的log event信息在binlog文件中是连续的，中间不会插入其他事务的log event。

Binlog文件操作

根据记录模式和操作触发event事件生成log event（事件触发执行机制）将事务执行过程中产生log event写入缓冲区，每个事务线程都有一个缓冲区Log Event保存在一个binlog_cache_mngr数据结构中，在该结构中有两个缓冲区，一个是stmt_cache，用于存放不支持事务的信息；另一个是trx_cache，用于存放支持事务的信息。事务在提交阶段会将产生的log event写入到外部binlog文件中。不同事务以串行方式将log event写入binlog文件中，所以一个事务包含的log event信息在
binlog文件中是连续的，中间不会插入其他事务的log event。

Binlog文件操作

Binlog状态查看

show variables like 'log_bin';

开启Binlog功能

set global log_bin = mysqllogbin; ERROR 1238 (HY000): Variable 'log_bin' is a read only variable

需要修改my.cnf或my.ini配置文件，在[mysqld]下面增加log_bin=mysql_bin_log，重启MySQL服务。

#log-bin=ON #log-bin-basename=mysqlbinlog binlog-format=ROW log-bin=mysqlbinlog

使用show binlog events命令

show binary logs; //等价于show master logs; show master status; show binlog events; show binlog events in 'mysqlbinlog.000001';

使用 mysqlbinlog 命令

mysqlbinlog "文件名" mysqlbinlog "文件名" > "test.sql"

使用 binlog 恢复数据

//按指定时间恢复 mysqlbinlog --start-datetime="2020-04-25 18:00:00" --stop- datetime="2020-04-26 00:00:00" mysqlbinlog.000002 | mysql -uroot -p1234 //按事件位置号恢复 mysqlbinlog --start-position=154 --stop-position=957 mysqlbinlog.000002 | mysql -uroot -p1234

mysqldump：定期全部备份数据库数据。mysqlbinlog可以做增量备份和恢复操作。

删除Binlog文件

purge binary logs to 'mysqlbinlog.000001'; //删除指定文件 purge binary logs before '2020-04-28 00:00:00'; //删除指定时间之前的文件 reset master; //清除所有文件

可以通过设置expire_logs_days参数来启动自动清理功能。默认值为0表示没启用。设置为1表示超出1天binlog文件会自动删除掉。

Redo Log和 Binlog区别

Redo Log是属于InnoDB引擎功能，Binlog是属于MySQL Server自带功能，并且是以二进制文件记录。Redo Log属于物理日志，记录该数据页更新状态内容，Binlog是逻辑日志，记录更新过程。Redo Log日志是循环写，日志空间大小是固定，Binlog是追加写入，写完一个写下一个，不会覆盖使用。Redo Log作为服务器异常宕机后事务数据自动恢复使用，Binlog可以作为主从复制和数据恢复使用。Binlog没有自动crash-safe能力。

推荐学习：mysql视频教程

以上就是图文详解mysql架构原理的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/175658.html

mysql

赞 (0)

打赏微信扫一扫支付宝扫一扫

0 0

生成海报

关于作者

程序猿签约作者

413.8K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

尼康将于2028年推出新的ArF浸润式光刻机
上一篇 2025年11月1日 04:52:52

如何搭建linux服务器
下一篇 2025年11月1日 04:52:56

相关推荐

 用户投稿

网络进化！

Web 应用程序从静态网站到动态网页的演变是由对更具交互性、用户友好性和功能丰富的 Web 体验的需求推动的。以下是这种范式转变的概述： 1. 静态网站（1990 年代）定义：静态网站由用 HTML 编写的固定内容组成。每个页面都是预先构建并存储在服务器上，并且向每个用户传递相同的内容。技术：HT…

程序猿
2025年12月24日
0000

用户投稿

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000

用户投稿

CSS如何实现任意角度的扇形（代码示例）

本篇文章给大家带来的内容是关于CSS如何实现任意角度的扇形（代码示例），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。扇形制作原理，底部一个纯色原形，里面2个相同颜色的半圆，可以是白色,内部半圆按一定角度变化，就可以产生出扇形效果扇形绘制 .shanxing{ position:…

程序猿
2025年12月24日
1000

用户投稿

html中怎么运行sql语句_html中运行sql语句方法【教程】

必须通过后端服务执行SQL操作。一、PHP与MySQL交互：使用PHP脚本在服务器端连接数据库，执行查询并嵌入HTML输出，避免硬编码凭证。二、Ajax调用API：前端通过JavaScript向后端API发送请求，服务端执行SQL并返回JSON数据，前端动态渲染结果。三、SQLite与JavaScr…

程序猿
2025年12月23日
2000

用户投稿

html手机怎么运行_手机运行html方法【教程】

1、使用手机浏览器可直接打开本地HTML文件，只需通过文件管理器点击文件并选择浏览器打开即可预览；2、借助Spck Editor等专用编辑器应用能实现实时编辑与预览，适合开发调试；3、对于含JavaScript或需服务器支持的动态内容，应安装KSWEB类应用搭建本地服务器，再通过http://loc…

程序猿
2025年12月23日
1000

用户投稿

html如何连接_连接HTML与数据库或API接口【接口】

HTML无法直接连接数据库或调用API，需借助JavaScript fetch、PHP中转、Node.js后端或Python Flask等服务端技术实现动态数据交互。如果您希望在网页中动态获取数据，HTML本身无法直接连接数据库或调用API接口，必须借助服务器端语言或JavaScript等客户端技…

程序猿
2025年12月23日
1000

用户投稿

HTML如何添加批注功能_评论系统实现方案【教程】

可实现HTML文本批注功能的四种方案：一、基于HTML5自定义属性与JS的静态批注；二、遵循W3C标准的语义化批注；三、嵌入Utterances或Giscus等第三方评论系统；四、自建AJAX评论后端+前端组件。如果您希望在HTML页面中为特定文本添加可交互的批注功能，或构建一个轻量级的评论系统，…

程序猿
2025年12月23日
0000

用户投稿

html怎么在本地服务器运行_本地服务器运html方法【指南】

使用本地服务器运行HTML文件需通过HTTP协议，可选Python命令启动服务、Node.js的http-server、VS Code的Live Server插件或XAMPP等工具，确保AJAX等功能正常。要在本地服务器运行HTML文件，不能直接双击打开，因为部分功能（如AJAX、API调用）需要…

程序猿
2025年12月23日
3000

用户投稿

phpstudy怎么运行本地html_phpstudy运行本地html方法【教程】

确保Apache或Nginx服务已启动；2. 将HTML文件放入WWW目录；3. 浏览器访问localhost即可运行页面。在使用 PHPStudy 时，运行本地 HTML 文件非常简单。PHPStudy 是一个集成了 Apache/Nginx、PHP 和 MySQL 的集成环境工具，主要用于本地…

程序猿
2025年12月23日
1000

用户投稿

HTML页面如何生成短链接_URL压缩转换方法【攻略】

可借助第三方服务、API调用、Nginx反向代理、PHP脚本或GitHub Pages五种方式将HTML页面URL转为短链接：1.用bit.ly等平台手动缩短；2.调用Bitly API批量生成；3.配置Nginx rewrite规则重定向；4.部署PHP+MySQL实现动态跳转；5.利用GitHu…

程序猿
2025年12月23日
1000

用户投稿

Java JDBC中SQL INSERT语句的常见语法错误及修复指南

本文旨在解决java jdbc应用中常见的sql `insert`语句语法错误，特别是因缺少括号而导致的错误。我们将深入分析错误信息，指出问题根源，并提供正确的sql语句范例及java jdbc `preparedstatement`的使用方法。文章还将涵盖jdbc数据库操作的最佳实践、错误处理和调…

程序猿
2025年12月23日
0000

用户投稿

wampserver怎么运行html程序_wampserver运行html程序方法【教程】

使用WampServer运行HTML程序需将文件放入www目录，启动Apache服务后通过http://localhost/项目路径访问，确保在本地服务器环境下正确解析运行。如果您在本地开发网页，但无法正确查看HTML文件的运行效果，可能是由于未通过本地服务器环境进行访问。WampServer 提…

程序猿
2025年12月23日
0000

用户投稿

平板怎么运行html代码_平板运行html代码步骤【指南】

可在平板上通过四种方式查看HTML效果：一、用浏览器直接打开本地.html文件；二、使用JSFiddle等在线编辑器实时预览；三、安装Acode等编程应用离线编写并预览；四、通过KSWEB搭建本地服务器运行含动态内容的页面。如果您希望在平板设备上查看或测试HTML代码的效果，但不确定如何操作，则可…

程序猿
2025年12月23日
0000

用户投稿

html上怎么运行php代码吗_html中运行php代码方法【教程】

要使PHP代码在HTML中执行，必须通过支持PHP的服务器环境。首先将文件保存为.php格式并部署到配置好PHP模块的服务器（如Apache）根目录，通过http://localhost访问；或修改服务器配置（如.htaccess）令.html文件解析PHP；推荐使用.php文件混合HTML与PHP…

程序猿
2025年12月23日
0000

用户投稿

html怎么用sublime运行php_sublime运行html中php方法【教程】

可在Sublime Text中通过配置PHP环境变量并创建Build System运行PHP代码，或使用PHP内置服务器、XAMPP等集成环境结合浏览器预览实现解析与调试。如果您在使用Sublime Text编辑HTML或PHP文件时，希望直接运行PHP代码并查看输出结果，但发现无法像在浏览器中那…

程序猿
2025年12月23日
1000

用户投稿

PHP表单提交后防止页面刷新并保留数据与错误提示的教程

本教程旨在解决php表单提交时页面刷新、用户输入数据丢失以及错误提示显示不佳的问题。核心方法是利用服务器端php的`$_post`变量，在表单提交并进行服务器端验证失败后，不进行页面重定向，而是直接在当前页面重新渲染表单，同时回填用户之前输入的数据并显示验证错误信息，从而显著提升用户体验。引言：优…

程序猿
2025年12月23日
0000

用户投稿

如何通过JavaScript/jQuery获取HTML元素内容并与PHP后端交互

本教程详细阐述了如何利用JavaScript和jQuery从HTML页面中动态获取特定` `标签的文本内容，并进一步探讨了如何将这些前端捕获的数据通过AJAX技术安全地传递给PHP后端进行处理，例如执行SQL查询。文章涵盖了从前端事件触发、数据捕获到后端数据接收、处理及安全防护的全流程，旨在提供一个…

程序猿
2025年12月23日
0000

php怎么在html5中运行_php在html5中运行方法【教程】

PHP在服务器端运行，通过嵌入HTML5文件生成动态内容。1. PHP与HTML5协同工作：PHP代码嵌入.html或.php文件，由服务器解析后输出纯HTML至浏览器。2. 创建index.php文件，使用标准HTML5结构，在其中插入等PHP代码，实现动态内容展示。3. 搭建本地环境可选用XAM…

程序猿
2025年12月23日 • 用户投稿
0000

用户投稿

epp4怎么运行html文件_EPP4运行html文件步骤【指南】

首先确认EPP4已安装并启动Apache服务，将HTML文件放入www目录后，通过http://localhost/路径访问即可预览页面，确保文件位置与路径正确。打开EPP4后运行HTML文件并不复杂，只需正确操作即可在浏览器中预览页面效果。EPP4（Easy PHP Pack 4）是一个集成开发…

程序猿
2025年12月23日
1000

用户投稿

html怎么用浏览器运行php_浏览器运html中php文件方法【教程】

正确答案是搭建本地开发环境。需安装XAMPP等集成工具，将.php文件放入htdocs目录，通过http://localhost访问，确保服务器解析PHP并返回HTML给浏览器显示。 PHP 是服务器端语言，不能直接通过浏览器像 HTML 那样双击打开运行。你看到的“在浏览器中运行 PHP”其实是指…

程序猿
2025年12月23日
0000

发表回复
请登录后评论...
登录后才能评论