MySQL中varchar与char的区别及其底层存储原理探析

答案:CHAR是固定长度类型,适合存储长度固定的值,如哈希值、编码等,存取效率高且不易产生碎片;VARCHAR是可变长度类型,仅占用实际数据所需空间,适合存储长度不一的文本,节省存储但可能因更新引发行迁移。选择取决于数据长度是否固定、更新频率、索引需求及字符集影响,核心是在空间利用率与性能间权衡。

mysql中varchar与char的区别及其底层存储原理探析

MySQL中,

VARCHAR

CHAR

最核心的区别在于它们的存储方式:

CHAR

是固定长度的,无论你存入的数据有多长,它都会占用声明时指定的最大长度空间;而

VARCHAR

是可变长度的,它只占用实际存储数据所需的空间,外加一个或两个字节来记录数据的实际长度。这种差异直接影响着存储效率、查询性能乃至数据处理的细微行为。简单来说,

CHAR

以空间换时间,

VARCHAR

则致力于节省空间,但可能引入一点点额外的处理开销。

CHAR

VARCHAR

的选择,说到底,就是对存储空间和性能开衡量的艺术。我个人在设计数据库时,对这两个数据类型一直有着一番思考。

先说说

CHAR

吧。当你定义一个

CHAR(10)

的字段时,无论你存入“hello”还是“world_test”,它在磁盘上都会占用10个字节。如果数据不足10个字节,MySQL会在右侧用空格填充;读取时,通常又会把这些填充的空格去除(这在不同SQL模式下行为可能略有差异,但多数情况下我们感知不到)。这种固定长度的特性,让MySQL在处理

CHAR

类型的数据时效率很高,因为它知道每条记录的这个字段在哪里结束,无需额外计算。对于那些长度总是固定不变的数据,比如MD5哈希值(

CHAR(32)

)、SHA1值(

CHAR(40)

)、国家代码(

CHAR(2)

)或者一些内部的状态码,

CHAR

无疑是更优的选择。它能提供更快的存取速度,并且在内存中分配也是固定大小,减少了变长数据可能带来的内存碎片问题。

VARCHAR

,它就显得“灵活”多了。定义一个

VARCHAR(255)

的字段,如果你存入“hello”,它实际只占用5个字节的数据空间,外加1个字节来记录这个“5”的长度信息。如果数据长度超过255个字节(当然,这取决于字符集,UTF8MB4下255个字符可能远超255字节),就需要2个字节来记录长度了。这种按需分配的存储方式,在处理像姓名、地址、文章标题这类长度不定的文本数据时,能显著节省存储空间。想象一下,如果一个字段可能存入短短几个字的标题,也可能存入几十个字的描述,用

CHAR

就会造成大量的空间浪费。

VARCHAR

的这种节省空间特性,对于大型数据库来说,意味着更少的磁盘I/O,因为更多的数据可以被塞进一个数据页,从而提高整体的查询效率。但它也有其代价:每次读写都需要额外处理长度字节,而且当

VARCHAR

字段的数据长度发生变化时,尤其是在更新操作导致数据变长时,可能会引发行迁移(row migration)或页分裂(page split),这会增加I/O开销,影响性能。

从底层存储原理来看,InnoDB存储引擎在处理这两种类型时,也有一些值得注意的地方。对于

CHAR

类型,由于其固定长度,InnoDB在数据页上会为该字段预留固定的空间。这使得数据的物理存储非常规整,查找起来也更直接。对于

VARCHAR

,InnoDB的

COMPACT

DYNAMIC

等行格式对其处理方式有所不同。

DYNAMIC

COMPRESSED

行格式在处理大

VARCHAR

字段时,会将部分数据存储在溢出页(off-page storage)中,而不是直接存储在数据行内,这有助于保持数据行较小,减少行迁移的发生,但也会增加访问这些溢出数据的开销。字符集的影响也至关重要,比如

UTF8MB4

字符集下,一个字符可能占用1到4个字节。所以,

VARCHAR(100)

UTF8MB4

下,其最大实际存储字节数可能是400字节,加上长度字节,实际占用的空间会更多。

MySQL中,选择CHAR还是VARCHAR对性能有什么影响?

在我看来,

CHAR

VARCHAR

对性能的影响,是一个典型的“看场景”问题,没有绝对的优劣。

首先,对于

CHAR

类型,由于其固定长度的特性,在数据存取时,MySQL无需额外计算或解析长度信息,可以直接定位到字段的起始和结束位置。这种确定性使得

CHAR

在某些情况下表现出更好的性能,尤其是在查询、排序和索引操作中。比如,如果你有一个

CHAR(32)

的字段作为主键或频繁查询的索引列,由于索引的键值长度固定,索引树的遍历会更加高效,内存分配也更稳定。此外,

CHAR

字段在更新时,即使数据长度发生变化(比如从“a”更新为“b”),也不会导致存储空间的实际变化,因此不会引发行迁移或页分裂,这对于高并发的更新操作来说,是一个潜在的优势。

然而,

CHAR

的缺点在于可能造成的空间浪费。如果你的数据长度远小于声明的长度,那么这些被填充的空格就白白占用了磁盘空间,也增加了I/O的负担,因为需要读取更多无用的数据。在数据量庞大的表中,这种空间浪费积累起来可能非常可观,反而会降低整体性能,因为更少的数据能被缓存到内存中,导致更多的磁盘I/O。

再看

VARCHAR

类型,它的优势在于节省存储空间。对于长度变化大的数据,

VARCHAR

只存储实际数据,这能显著减少数据文件的体积。文件小了,意味着在同样的数据页中能存放更多行数据,从而减少磁盘I/O操作,提高缓存命中率。这对于读取操作来说,往往能带来整体性能的提升。

VARCHAR

性能劣势也显而易见。每次读取或写入时,MySQL都需要额外处理1到2个字节的长度信息。虽然这开销很小,但在海量数据和高并发场景下,累积起来也不容忽视。更重要的是,当

VARCHAR

字段的数据更新后,如果新数据的长度超过了旧数据的长度,并且在当前数据页上没有足够的连续空间来容纳,那么MySQL就可能需要进行行迁移。行迁移意味着将整行数据移动到新的数据页,并在原位置留下一个指向新位置的“指针”。频繁的行迁移会导致数据碎片化,降低数据访问效率,因为查询一行数据可能需要访问多个数据页。这在更新频繁、且数据长度波动大的场景下,对性能的影响是比较明显的。索引方面,

VARCHAR

索引的键值长度不固定,理论上会比

CHAR

索引略慢,但在实际应用中,这种差异往往微乎其微,远不如存储空间和行迁移的影响来得大。

所以,在选择时,我通常会权衡:数据长度是否固定?是否会频繁更新?数据量有多大?如果数据长度固定且不长,

CHAR

可能更优;如果数据长度可变且可能较长,

VARCHAR

几乎是必然的选择,但要警惕更新带来的行迁移问题。

VARCHAR的最大长度限制是65535,这具体指什么?

关于

VARCHAR

的65535字节限制,这是一个经常被误解的地方。很多人以为这意味着一个

VARCHAR

字段可以存储65535个字符,或者说它能单独占用65535字节。但实际上,这个限制指的是一张表的所有

VARCHAR

TEXT

BLOB

等可变长字段,在单行数据中,它们所能占用的最大总存储字节数(不包括那些真正存储在溢出页中的大对象数据)。换句话说,65535字节是MySQL一个数据行能够存储的最大物理长度,而不是单个

VARCHAR

字段的字符数上限。

神采PromeAI 神采PromeAI

将涂鸦和照片转化为插画,将线稿转化为完整的上色稿。

神采PromeAI 103 查看详情 神采PromeAI

这个限制是针对整个数据行的,并且它还包括了

VARCHAR

字段本身用于存储长度信息的1或2个字节。具体来说:

行总长度限制: MySQL的每个数据行(不包括

BLOB

TEXT

类型存储在溢出页的部分)不能超过65535字节。这意味着你表中的所有列(

CHAR

INT

DATE

等固定长度的,以及

VARCHAR

VARBINARY

等可变长度的)加起来的总字节数不能超过这个限制。字符集影响:

VARCHAR

的长度是按字符计算的,但其占用的字节数取决于所使用的字符集。例如,如果你的字段是

VARCHAR(255)

并使用了

UTF8MB4

字符集,那么一个字符最多可能占用4个字节。所以,

VARCHAR(255)

实际上可能占用

255 * 4 = 1020

字节,再加上1或2字节的长度前缀。显然,你不可能在一个

UTF8MB4

字符集的

VARCHAR

字段中定义

VARCHAR(65535)

,因为

65535 * 4

远远超出了65535字节的行限制。实际上,对于

UTF8MB4

,单个

VARCHAR

字段能存储的最大字符数大约是16383个字符(

65535 / 4 ≈ 16383

),再减去长度字节。长度前缀: 如果

VARCHAR

字段的声明长度小于或等于255字节,MySQL会用1个字节来存储其实际长度。如果声明长度大于255字节(且小于65535字节),则需要2个字节来存储实际长度。这个长度字节也计入65535字节的总限制。溢出页存储(Off-Page Storage): 对于InnoDB存储引擎,当一个

VARCHAR

字段非常大,以至于它会导致数据行超过65535字节的限制时,或者当它本身就超过了数据页的某个阈值时(比如半页大小),InnoDB会选择将这个大字段的部分或全部数据存储到溢出页(off-page storage)中。在这种情况下,数据行中只会存储一个指向溢出页的20字节指针,而不是实际的数据。这意味着,虽然单个

VARCHAR

字段的字符数可以非常大(理论上可以达到

TEXT

类型的限制),但行内存储的只是一个指针,从而满足了65535字节的行内限制。但这仅适用于

DYNAMIC

COMPRESSED

行格式。

所以,当你在设计表结构时,看到

VARCHAR

的65535字节限制,更应该把它理解为所有可变长字段的总和,以及它们在行内存储的上限,并结合字符集来计算实际的字节占用。如果你确实需要存储超过这个限制的单个大文本,

TEXT

BLOB

类型才是正确的选择,因为它们天生就是为溢出页存储设计的。

在实际开发中,如何根据业务场景合理选择CHAR和VARCHAR?

在实际的数据库设计中,选择

CHAR

还是

VARCHAR

,我通常会遵循几个原则,结合具体的业务场景来做决策。这不仅仅是技术上的选择,更是对未来数据增长、系统性能以及维护成本的一种预判。

1. 优先考虑数据长度的确定性:

如果数据长度总是固定不变的:毫无疑问,选择

CHAR

。这是

CHAR

最理想的应用场景。例如:

MD5哈希值

CHAR(32)

UUID(不带分隔符)

CHAR(32)

国家代码(如ISO 3166-1 alpha-2):

CHAR(2)

邮政编码(如果你的业务场景中邮编长度是固定的):

CHAR(6)

CHAR(7)

性别

CHAR(1)

(’M’或’F’)。固定长度的内部编码或状态码。使用

CHAR

可以确保存储空间的统一,提高存取效率,并且在索引上表现更优。

如果数据长度可变,且变化范围较大:这时,

VARCHAR

几乎是唯一的选择。例如:

用户姓名

VARCHAR(100)

地址

VARCHAR(255)

文章标题或描述

VARCHAR(255)

甚至更大。评论内容

VARCHAR(500)

TEXT

VARCHAR

能有效节省存储空间,避免大量无效空格的存储,从而减少磁盘I/O。

2. 关注字段的更新频率和数据增长模式:

如果字段内容很少更新,或者更新后长度基本不变

VARCHAR

是一个很好的选择。即使数据长度有微小变化,也不会频繁触发行迁移。如果字段内容会频繁更新,并且更新后长度可能大幅度增长:这时需要特别小心

VARCHAR

。频繁的长度增长可能导致行迁移和数据碎片化,严重影响性能。在这种极端情况下,有时我会考虑预留比实际数据稍大的

VARCHAR

长度,以减少更新时的行迁移,或者干脆考虑使用

TEXT

类型,让MySQL自动处理溢出存储。

3. 考虑索引和查询效率:

作为索引列时

CHAR

索引由于键值长度固定,理论上性能会略优于

VARCHAR

索引。但在大多数现代系统中,这种差异微乎其微。更重要的是索引列的选择性长度本身。如果

VARCHAR

字段的实际数据长度很短,且选择性高,那么它作为索引列也是非常高效的。前缀索引:对于很长的

VARCHAR

字段,为了节省索引空间和提高效率,我们通常会创建前缀索引,例如

INDEX(col_name(10))

。这在

CHAR

上就不太需要,因为其本身就是固定长度。

4. 字符集的影响:

始终要记住字符集对字节数的影响。

VARCHAR(N)

中的

N

是字符数,不是字节数。

UTF8MB4

字符集下,一个字符最多占4字节。所以,定义

VARCHAR(255)

时,要清楚它在最坏情况下可能占用

255 * 4 = 1020

字节,加上长度字节,远超255字节。这会影响到整个行的长度限制。

5. 避免过度优化或过度保守:

不要为了节省几个字节而牺牲可读性和可维护性。例如,一个明显是变长的数据,没必要强行用

CHAR

,然后通过应用程序去补齐或截断。也不要过度保守,给

VARCHAR

设置一个远超实际需求的巨大长度。虽然

VARCHAR

只存储实际数据,但声明的长度过大,会影响内存分配(在某些操作中,MySQL可能会根据声明长度分配内存),并且在某些情况下,过大的声明长度可能会阻止MySQL进行某些优化。例如,

VARCHAR(255)

只需要1个字节存储长度,而

VARCHAR(256)

就需要2个字节。

总结一下,我个人的经验是:对于固定长度、长度较短且频繁用作索引或查询条件的字段,倾向于使用

CHAR

。对于绝大多数文本数据,特别是长度不确定、变化范围大的字段,果断选择

VARCHAR

。对于那些特别长、且不常作为查询条件的文本,如文章正文、大段描述,则会考虑使用

TEXT

类型。核心思想是根据数据本身的特性和业务需求,做出最平衡的选择。

以上就是MySQL中varchar与char的区别及其底层存储原理探析的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/943031.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
记一次内部分享——瞎扯淡
上一篇 2025年11月29日 19:16:09
DALL-E怎么设计AI民间故事插图_DALL-E设计AI民间故事插图详细流程说明
下一篇 2025年11月29日 19:16:12

相关推荐

  • composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

    require用于声明项目运行必需的依赖,如框架、数据库组件和第三方SDK,这些包会随项目部署到生产环境;2. require-dev用于声明仅在开发和测试阶段需要的工具,如PHPUnit、PHPStan、Faker等,不会默认部署到生产环境;3. 安装时composer install根据环境决定…

    2026年5月10日
    1000
  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • php常量怎么用_PHP常量(define/const)定义与使用方法

    PHP中可通过define函数和const关键字定义常量,用于存储不可变值。define适用于全局作用域,支持动态名称和条件定义,如define(‘SITE_NAME’, ‘MyWebsite’);const在编译时生效,语法简洁但限制多,只能在类或全…

    2026年5月10日
    000
  • MySQL数据库不支持中文的解决办法

    接上一篇文章,在解决了mysql+flask环境配置问题之后,往数据库存中文字符串会报1366错误,提示不正确的字符。继而发现默认的mysql采用了latin1字符集,这种编码是不支持中文的。 如果想支持中文的话,需要设置一下mysql字符集。 众所周知utf-8是可以的,gbk也没问题,为了可扩展…

    用户投稿 2026年5月10日
    000
  • Go语言接口与切片:如何识别和操作[]interface{}

    本文将深入探讨Go语言中如何识别和操作`[]interface{}`类型的切片。我们将介绍类型断言(Type Assertion)的关键作用,并通过`switch`语句演示如何安全地检测`[]interface{}`类型,并进而遍历其内部元素。文章旨在提供清晰的示例代码和专业指导,帮助开发者有效地处…

    2026年5月10日
    000
  • c++中头文件和源文件的区别_c++头文件与源文件作用对比

    头文件声明接口,源文件实现逻辑。头文件含类、函数声明及宏定义,通过#include被多文件共享,用include守卫防重;源文件实现具体功能,编译为目标文件后由链接器合并。声明与实现分离提升模块化与编译效率,模板和内联函数因需编译时可见故常置于头文件,命名空间避免符号冲突,整体结构使项目更清晰易维护…

    2026年5月10日
    000
  • Go语言连接外部MySQL数据库:DSN配置与常见错误解析

    本文详细阐述了go语言使用`go-sql-driver/mysql`驱动连接外部mysql数据库的正确方法。重点介绍了数据源名称(dsn)的规范格式,特别是主机地址部分的配置,以避免常见的“getaddrinfow: the specified class was not found.”等网络解析错…

    2026年5月10日
    000
  • Go语言中复制数组的几种方法详解

    本文介绍了在 Go 语言中复制数组和切片的几种方法,重点讲解了内置的 `copy` 函数的使用方式,以及在多维切片场景下深拷贝与浅拷贝的区别,并提供了相应的代码示例。通过本文,你将掌握在不同场景下选择合适的复制方法,避免潜在的陷阱。 在 Go 语言中,复制数组和切片是一个常见的操作。根据不同的需求,…

    2026年5月10日
    000
  • 后缀php怎么打开_php文件打开方式与运行环境搭建指南

    要打开PHP文件需根据用途选择方式:查看代码可用文本编辑器或IDE,运行则需服务器环境。推荐新手使用XAMPP、WAMP等集成环境,将文件放入htdocs目录后访问localhost;开发者可利用PHP内置服务器,命令行执行php -S localhost:8000运行;高级用户可手动配置Apach…

    2026年5月10日
    000
  • 解决PHP foreach循环中变量“继承”问题:理解与避免意外数据泄露

    本文探讨PHP foreach循环中一个常见的陷阱:当循环内部的数组或变量未被显式初始化时,其值可能会“继承”自上一次循环迭代,导致意外的数据泄露和逻辑错误。文章将深入分析这一现象的根源,并通过示例代码展示如何通过在每次迭代开始时正确初始化变量来解决此问题,确保代码行为的预期一致性。 引言:fore…

    2026年5月10日
    100
  • Pandas:基于条件和 Groupby 替换列中的特定字符

    本文介绍了如何使用 Pandas 库,结合 groupby 函数和字符串操作,根据特定条件替换 DataFrame 列中的字符。通过累积计数和字典映射,能够灵活地修改列中的特定部分,并根据替换值调整相关文本,实现数据清洗和转换的目的。 在数据分析和处理中,经常需要根据特定条件修改 DataFrame…

    2026年5月10日
    000
  • PHP动态网页数据库备份恢复_PHP动态网页MySQL数据库备份教程

    答案:PHP动态网页的MySQL数据库备份与恢复需通过定期导出SQL文件并安全存储来保障数据安全,核心方法包括使用mysqldump命令行工具实现高效灵活的自动化备份,利用phpMyAdmin图形化工具进行手动导出导入以降低操作门槛,以及通过PHP脚本调用系统命令将备份过程集成到应用中;恢复时可采用…

    2026年5月10日
    000
  • HTML文档脚本怎么加载_HTML加载JavaScript教程

    脚本应优先通过defer或async异步加载以避免阻塞渲染;将脚本放在body底部可防阻塞,但推荐使用defer确保DOM解析完成后再执行;async适用于独立脚本,defer用于依赖DOM或需顺序执行的脚本;优化方式包括代码分割、懒加载、CDN加速和浏览器缓存;加载失败时应重试、降级处理并监控错误…

    2026年5月10日
    000
  • Go语言中sync.WaitGroup的深度解析与实践

    sync.WaitGroup是Go语言中用于并发编程的重要同步原语,它允许主协程等待一组子协程执行完毕。本文将深入探讨WaitGroup的工作原理、典型使用模式及其与sync.Mutex等其他同步机制的区别,并通过实际代码示例,帮助读者掌握其在并发控制中的应用,避免常见的误区,确保并发程序的正确性和…

    2026年5月10日
    000
  • php登录怎么实现_php用户登录系统完整实现

    <blockquote>PHP用户登录系统的核心是安全验证与会话管理。首先创建POST提交的登录表单,避免敏感信息暴露;后端通过session_start()启动会话,使用trim()和htmlspecialchars()清理输入,防止XSS攻击;利用PDO预处理语句查询数据库,防止SQ…

    用户投稿 2026年5月10日
    000
  • Python怎么实现一个上下文管理器_Python上下文管理器协议实现

    自定义Python上下文管理器需实现__enter__和__exit__方法,前者在进入with块时获取资源并返回对象,后者在退出时释放资源并可处理异常;通过类或contextlib.contextmanager装饰生成器函数均可创建;文件操作中with open()自动关闭文件是典型应用;__ex…

    2026年5月10日
    000
  • JavaScript解释器_javascript代码执行

    JavaScript通过引擎解析执行,先语法分析生成AST,再编译为字节码或机器码,最后执行;执行时创建上下文并入栈,同步代码直接运行,异步任务由API处理后回调入队,事件循环在调用栈空时将回调推入执行;此机制解释了变量提升、暂时性死区及宏任务与微任务执行顺序差异。 JavaScript代码的执行依…

    2026年5月10日
    000
  • 远程MySQL数据库连接指南:从本地PHP应用访问GCP实例数据库

    本文详细指导如何在本地php应用中连接到google cloud platform (gcp) 虚拟机实例上的远程mysql数据库。教程涵盖了数据库连接参数的配置、使用php pdo建立连接的方法、gcp环境下的网络配置要点,以及常见的安全和故障排除建议,旨在帮助开发者顺利实现跨环境的数据库通信。 …

    2026年5月10日
    000
  • CSS的display属性有哪些值?inline和block有什么区别?

    CSS的display属性有哪些值?inline和block有什么区别?CSS的display属性有哪些值?inline和block有什么区别?CSS的display属性有哪些值?inline和block有什么区别?CSS的display属性有哪些值?inline和block有什么区别?

    css的display属性通过定义元素的显示方式来控制网页布局。1.block元素独占一行,可设置宽高,默认如div、p等;2.inline元素不独占行,宽高由内容决定,如span、a;3.inline-block兼具block和inline特性,可并排显示且能设尺寸;4.none隐藏元素且不占空间…

    2026年5月10日 用户投稿
    000
  • C++怎么使用静态库和动态库_C++链接静态库与动态库的方法与区别

    静态库在编译时链接,生成独立可执行文件;动态库运行时加载,节省内存。1. 静态库用ar打包.o文件为.a,编译时通过-L和-l链接;2. 动态库需-fPIC编译生成.so,运行前配置LD_LIBRARY_PATH或系统路径;3. 静态库体积大但部署方便,动态库共享内存利于更新。 在C++项目开发中,…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信