如何在高并发下，保证共享数据的一致性

百晓生 • 2025年11月12日 12:45:49 • 用户投稿 • 阅读 0

在高并发环境下，要保证共享数据的一致性，核心在于通过一系列严谨的、从数据库到应用架构层面的“并发控制”机制，来确保多个并行的操作，在逻辑上，能够像“串行”执行一样，产生一个确定的、符合业务规则的正确结果。一套全面、健壮的数据一致性保障体系，其构建必须系统性地涵盖五大关键策略：运用“锁”机制保障操作的“互斥性”、通过“事务”确保一系列操作的“原子性”、在分布式系统中选择合适的“一致性模型”、利用“消息队列”等工具实现“最终一致性”、以及在架构设计层面采用“无锁”或“数据分片”等策略。其中，通过“事务”确保一系列操作的“原子性”，是保障数据一致性的“基石”。

一个事务，就如同一个“保险箱”，它将一系列独立的数据库读写操作，都包裹在了一个“要么全部成功、要么全部失败”的、不可分割的单元之中。如果在事务执行的过程中，发生了任何错误，整个事务，都会被“回滚”到操作开始前的原始状态，从而，从根本上，杜绝了数据，因为“操作执行了一半”而被遗留在一种“中间的、不一致的”残缺状态的风险。

一、问题的根源、并发下的“数据混沌”

在探讨“如何保证”之前，我们必须首先，深刻地，理解“为何会不一致”。在单用户、低并发的环境中，数据的一致性，通常是自然而然的。然而，一旦进入高并发的世界，多个用户或进程，在几乎同一微秒，对同一个共享数据，进行“读取-修改-写回”的操作时，一场“数据的混沌”风暴，就将不可避免地降临。

1. 经典的“商品库存”场景

这是一个最能直观地，揭示并发问题所在的经典案例：

场景：一件热门商品，其在数据库中的库存，只剩下最后1件。

并发事件：在几乎完全相同的时间点，用户A和用户B，都点击了“购买”按钮。这两个请求，被分配到了服务器的两个不同线程（线程A和线程B）上，并行地开始处理。

一个未经保护的、灾难性的执行时序：

时刻1：线程A，从数据库中，读取商品库存，得到值为1。

时刻2：线程A，在内存中，进行逻辑判断：1 > 0，库存充足，可以购买。

时刻3：此时，发生了一次线程切换！ 操作系统，暂停了线程A的执行，转而去执行线程B。

时刻4：线程B，也从数据库中，读取商品库存。因为线程A的修改，尚未被写回，所以，它读取到的值，依然是1。

时刻5：线程B，在内存中，也进行了逻辑判断：1 > 0，库存充足，可以购买。

时刻6：线程B，执行“写回”操作，将库存修改为1 - 1 = 0，并更新到数据库中。然后，为用户B，创建了订单。

时刻7：线程再次切换，回到线程A。

时刻8：线程A，从上次被暂停的地方，继续执行。它基于自己早已“过时”的、在时刻1读取到的旧数据，执行“写回”操作，将库存，再次，修改为1 - 1 = 0，并为用户A，也创建了订单。

最终结果：一件商品，被成功地，卖给了两个人。数据库中的库存，变为了-1（如果字段允许负数）。数据，进入了严重的“不一致”状态。

2. 一致性的“定义”

数据一致性，是指数据，在其生命周期中的任何时间点，都必须，处于一种符合预设业务规则的、有效的、逻辑自洽的状态。例如，“商品库存，永远不能为负数”，就是一条业务规则。

二、方案一、“单体”世界中的“强一致性”

对于那些运行在“单个”数据库服务器上的、传统的“单体”应用而言，我们通常，会追求一种最高级别的、可立即验证的“强一致性”。

1. “锁”机制：从“悲观”到“乐观”

“锁”，是实现并发控制的、最基础、也最直接的工具。

悲观锁：它秉持一种“悲观”的哲学，即“假设冲突，总是会发生”。因此，它在对数据，进行任何操作之前，会先** preemptively**地，将这条数据“锁定”。

实现方式：例如，在数据库中，使用SELECT ... FOR UPDATE语句。当一个事务，执行了这条语句后，数据库，就会将该行数据锁定。任何其他的事务，如果也想修改这一行，就必须“排队等待”，直到前一个事务，完成并“释放”锁为止。

优缺点：数据一致性保障极高，但因为“串行化”了并行操作，所以，会牺牲掉一部分的“并发性能”。

乐观锁：它秉持一种“乐观”的哲学，即“假设冲突，是小概率事件”。它不会在操作前加锁，而是在**最终“提交更新”**的那一刻，去检查，数据，是否已经被其他线程所修改。

实现方式：通常，会在数据表中，增加一个“版本号”字段。

线程A，读取数据时，会同时读取其“版本号”（例如，v=1）。

当线程A，准备写回数据时，它的更新语句，会变成：UPDATE products SET stock = 0, version = 2 WHERE id = ? AND version = 1。

如果，在此期间，线程B，已经抢先一步，修改了库存，那么，该行数据的版本号，就已经变成了2。此时，线程A的UPDATE语句，会因为version = 1这个条件不满足，而更新失败（影响行数为0）。

优缺点：并发性能，远高于悲观锁。但如果“冲突”频繁发生，那么，大量的“重试”操作，反而会降低整体性能。

2. 数据库“事务”：原子性的保障

事务，是将一系列独立的数据库读写操作，打包成一个“不可分割”的、“要么全部成功，要么全部失败”的“原子”单元的、最核心的机制。一个符合ACID标准（即原子性、一致性、隔离性、持久性）的事务，能够从根本上，保障在一个操作序列中的数据一致性。在开篇的“商品库存”案例中，只要我们将“读取库存 -> 判断库存 -> 修改库存”这三个步骤，完整地，包裹在一个“事务”中，并配合“悲观锁”，那么，当线程A，在事务中，执行SELECT ... FOR UPDATE时，线程B的SELECT ... FOR UPDATE请求，就会被阻塞，直到线程A的整个事务，提交或回滚为止。

三、挑战的“升维”：分布式系统的一致性

当我们的业务，发展到需要将数据，分散存储在多个独立的服务器（即“分布式系统”）上时，一致性的保障，其难度，会呈指数级上升。

1. CAP定理的“三难困境”

CAP定理，是分布式系统领域的“基石”理论。它指出，任何一个分布式系统，在以下三个核心指标中，最多，只能同时，满足其中两个：

一致性：任何一次读操作，都能读取到“最新的”写操作的结果。

可用性：任何一次请求，都能收到一个“非错误”的响应，但不保证数据是最新的。

分区容错性：系统在遇到“网络分区”（即节点间的网络连接中断）时，依然能够继续对外提供服务。

在现实世界的、一个必然会遇到网络故障的分布式系统中，“分区容错性”，是一个必须被保障的基础。因此，我们，常常被迫地，在“一致性”和“可用性”之间，做出一个艰难的“权衡取舍”。

2. BASE理论与“最终一致性”

为了应对这种“三难困境”，许多大型的互联网系统，都选择，放弃“强一致性”，而遵循“BASE理论”，追求一种更具弹性和扩展性的“最终一致性”。

BASE理论，即基本可用、软状态和最终一致。

最终一致性，意味着，系统，并不保证，在数据写入后的“任何时刻”，所有节点上的数据，都是完全一致的。但它“承诺”，在经过了一个短暂的“不一致窗口期”之后，所有节点上的数据，最终，都将会，达到一个一致的状态。

四、方案二、“分布式”世界中的“最终一致性”

1. 分布式事务的“两阶段提交”与“补偿事务”

为了在分布式环境下，实现多个独立服务之间的“事务性”操作，业界发展出了“两阶段提交”、“补偿事务”等复杂的分布式事务协议。它们，通过引入一个“协调者”的角色，来尽力地，模拟传统单体数据库的事务行为。但因为其实现的复杂性和对性能的巨大影响，在许多互联网场景下，团队更倾向于，采用基于“消息”的、更松耦合的最终一致性方案。

2. 核心模式：基于“消息队列”的异步通信

消息队列（如Kafka, RabbitMQ），是实现最终一致性的、最常用、也最可靠的“核心基础设施”。

场景：在一个电商系统中，“订单服务”，在创建了一个新订单后，需要通知“库存服务”，去扣减库存，并通知“积分服务”，去为用户增加积分。

最终一致性的实现：

“订单服务”，在自己的本地数据库事务中，成功地，创建了订单。

然后，它并不直接地，去远程调用“库存服务”和“积分服务”的接口（因为，这些调用，可能会失败或超时）。

取而代之，它，向一个高可用的“消息队列”中，发送一条包含了订单信息的、可靠的“订单已创建”的消息。

“库存服务”和“积分服务”，则作为“消费者”，分别地，“订阅”了这个消息。

当它们，收到这条消息后，再各自地，在自己的服务内部，执行“扣减库存”和“增加积分”的操作。

优点：这种模式，通过“消息中间件”，将原本紧耦合的、同步的调用，进行了解耦，极大地，提升了系统的“可用性”和“弹性”。即便“库存服务”暂时宕机，也不会影响到“订单服务”的正常运行。

五、在流程与实践中“抉择”

一致性，并非一个“越高越好”的单一指标。在不同的业务场景下，我们需要，有策略地，选择不同“级别”的一致性模型。

需要“强一致性”的场景：所有与“金钱”和“交易”直接相关的核心流程，例如，支付、下单、核心库存等。在这些场景下，我们必须，不计代价地，采用数据库的“事务”和“悲观锁”等机制，来保障数据的绝对一致。

可接受“最终一致性”的场景：大量的、非交易核心的场景，例如，用户动态的更新、文章点赞数的显示、非核心信息的跨系统同步等。在这些场景下，短暂的数据不一致，对用户体验的影响很小，我们可以，放心地，采用基于“消息队列”的最终一致性方案，来换取系统更高的可用性和可扩展性。

常见问答 (FAQ)

Q1: “强一致性”和“最终一致性”哪个更好？

A1: 两者并无绝对的“好坏”之分，只有“适用场景”的不同。“强一致性”，提供了最可靠的数据保证，但牺牲了部分的“性能”和“可用性”。而“最终一致性”，则通过接受一个短暂的“不一致”窗口，来换取系统极高的“可用性”和“可扩展性”。

Q2: 什么是“ACID”？

A2: “ACID”，是数据库事务，必须具备的四个核心特性：原子性（一个事务，是不可分割的工作单元，要么全做，要么全不做）、一致性（事务，必须使数据库，从一个一致性状态，转变到另一个一致性状态）、隔离性（并发执行的事务之间，不应相互干扰）和持久性（一旦事务提交，其结果，就是永久性的）。

Q3: 为什么说在分布式系统中，我们必须在“一致性”和“可用性”之间做出选择？

A3: 这是由“CAP定理”所决定的。因为，在分布式系统中，“网络分区”（即网络故障）是不可避免的。当网络分区发生时，一个节点，为了保证“一致性”，就必须拒绝那些可能“过时”的读写请求，从而，牺牲了“可用性”。反之，如果它为了保证“可用性”，而继续处理请求，那么，它所处理的数据，就可能是“过时”的，从而，牺牲了“一致性”。

Q4: “乐观锁”和“悲观锁”有什么区别？

A4: 两者的核心区别，在于对“并发冲突”的“假设”不同。“悲观锁”，假设冲突“很可能会发生”，所以，在操作数据“之前”，就先将其“锁定”。而“乐观锁”，则假设冲突“很少会发生”，所以，它在操作前“不加锁”，而只是在最终“提交更新”时，才去“检查”，在此期间，数据是否已被其他线程修改过。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：百晓生，转转请注明出处：https://www.chuangxiangniao.com/p/638958.html

软件开发高并发

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

百晓生签约作者

26.7K 文章

0 评论

0 粉丝

上知天文，下知地理，中晓人和，明阴阳，懂八卦！

豆包AI如何实现智能排班豆包AI人力资源调度功能

上一篇 2025年11月12日 12:45:39

为什么两个线程会互相等待，导致程序“死锁”

下一篇 2025年11月12日 12:45:52

用户投稿

Go语言Cgo代码GDB调试失效：Go 1.1版本下的挑战与官方进展

本文探讨了go语言程序中cgo代码在使用gdb进行调试时遇到的挑战，特别指出go 1.1版本中存在的变量值显示异常问题。该问题是一个已知的官方缺陷（go issue 5221），导致在cgo交互部分gdb调试功能失效，而go 1.0版本则无此问题。文章将通过示例代码重现该现象，并阐述其根源及官方的解…

程序猿
2026年5月10日
0000
用户投稿

Go语言中实现策略模式：灵活处理多源数据与格式转换

本文探讨了如何在go语言中实现策略模式，以优雅地处理多源数据收集与多格式数据转换的场景。通过定义清晰的接口和具体的策略实现，结合go语言简洁的特性，展示了两种将策略集成到工作流中的方法，强调了go中接口驱动的灵活性。在软件开发中，我们经常面临需要处理多种算法或行为，并根据具体情况选择其中之一的场景…

程序猿
2026年5月10日
0000
用户投稿

Go与.NET互操作：在Go应用中调用.NET库的策略

本文探讨了在go应用中集成.net库或ui的策略。核心方法是通过在go进程中宿主.net clr，利用c-callable dll作为桥梁。文章将介绍这种技术的可行性，并讨论实现过程中可能遇到的技术细节和注意事项，帮助开发者实现go与.net之间的互操作性。引言在现代软件开发中，跨语言互操作性是…

程序猿
2026年5月10日
0000
用户投稿

深入理解Go语言中的内存重排序：GOMAXPROCS与并发编程实践

本文深入探讨go语言中内存重排序现象的观察与机制。通过分析一个go并发代码示例，揭示了go运行时环境，特别是`gomaxprocs`设置（在go 1.5版本之前）如何影响内存重排序的显现。文章强调，在单核环境下，即使存在潜在的重排序可能，也难以被观察到，并指导开发者如何正确理解go的内存模型及其并发…

程序猿
2026年5月10日
0000
用户投稿

纯CSS与HTML网格布局优化：精简冗余代码的策略

本教程探讨了在纯CSS和HTML环境中，如何优化重复性极高的网格布局代码。针对一个13×13的矩阵设计，我们提出了两种主要策略：一是通过JavaScript将网格数据编码为字符串并动态生成DOM元素，大幅减少HTML冗余；二是在严格限制纯HTML/CSS时，利用SVG的路径绘制能力，以矢量…

程序猿
2025年12月23日
0000
用户投稿

GemBox.Document HTML转PDF垂直文本渲染问题及解决方案

本教程旨在解决使用gembox.document将包含css `writing-mode`属性的html转换为pdf时，垂直文本未能正确显示的问题。核心解决方案是升级gembox.document库至支持该属性的最新热修复版本，以确保html中定义的垂直布局在pdf输出中得到精确还原，提升文档转换的…

程序猿
2025年12月23日
3000
深入解析HTML URL验证与Unicode字符处理

本文深入探讨了W3C验证器在处理包含Unicode补充字符的URL路径时曾出现的一个特定错误。该问题源于验证器URL解析逻辑中对UTF-16编码下代理对字符（如?）的索引递减处理不当，导致其在特定相对路径（如`/?`）下被错误地标记为无效，而其他路径则正常。文章详细阐述了Unicode字符编码与UR…

程序猿
2025年12月23日 • 用户投稿
3000
W3C HTML验证器中Unicode字符路径解析的深度解析与修复

本文深入探讨了w3c html验证器在处理包含特定unicode字符（如?）的url路径时曾出现的验证错误。该问题源于验证器内部url解析逻辑对utf-16补充字符处理不当，未能正确计算字符索引。文章详细解释了java中utf-16编码与代理对的概念，以及修复方案如何通过引入character.ch…

程序猿
2025年12月23日 • 用户投稿
2000
用户投稿

JavaScript Trivia游戏答案判断错误问题排查与修复

本文旨在解决JavaScript Trivia游戏中答案判断始终返回第一个答案为正确的错误。通过分析问题代码，找出`checkAnswer`函数中`currentQuestion`变量的错误使用，并提供修改后的代码示例，帮助开发者理解和修复类似问题，确保Trivia游戏逻辑的正确性。在开发Triv…

程序猿
2025年12月23日
5000
用户投稿

优化JavaScript循环控制：使用函数进行break条件判断

本文探讨如何在JavaScript中将for循环的break条件逻辑从循环体中分离到独立函数，以降低代码复杂度。由于break语句的上下文限制，不能直接移出循环，因此需通过让外部函数返回布尔值来指示循环是否应终止，从而实现更清晰、可维护的循环控制。问题分析：break语句的限制在软件开发中，为了…

程序猿
2025年12月22日
0000
用户投稿

HTML表单如何实现负载测试？怎样模拟高并发提交？

使用jmeter进行html表单的负载测试，首先下载安装jmeter，创建测试计划并添加线程组配置并发用户数、启动时间及循环次数，接着添加http请求设置post方法、目标url及表单数据，通过csv data set config实现参数化以模拟真实用户，添加response assertion进…

程序猿
2025年12月22日
0000
用户投稿

静态重定位技术在软件开发中的应用探究

静态重定位技术在软件开发中的应用探究摘要：静态重定位技术是一种常用的软件开发技术，在程序编译阶段将程序中的地址信息修改为最终执行地址的过程。本文将探究静态重定位技术在软件开发中的应用，重点讨论其在多模块程序开发中的应用，以及通过具体代码示例，演示静态重定位技术的实际使用。引言随着软件开发的需求和…

程序猿
2025年12月21日
5000
用户投稿

多环境配置管理_开发测试生产环境的切换

多环境配置管理需分离差异项并自动化控制。1. 分离数据库、密钥、日志等环境特有配置；2. 使用application-{env}.yml文件按环境划分；3. 通过spring.profiles.active指定激活环境；4. 敏感信息用环境变量注入提升安全与灵活；5. CI/CD中自动选配并校验配置…

程序猿
2025年12月21日
3000
用户投稿

依赖版本锁定策略_保证项目稳定性的方案

依赖版本锁定通过锁文件明确第三方库版本，确保开发、构建、生产环境一致。提交锁文件、使用精确版本、定期更新并测试依赖，结合自动化工具平衡安全与稳定，可提升项目可维护性与交付质量。在软件开发过程中，依赖版本管理直接影响项目的稳定性与可维护性。不合理的依赖更新可能导致兼容性问题、构建失败甚至线上故障。为…

程序猿
2025年12月21日
0000
用户投稿

优化条件执行：在无else分支场景下使用逻辑与(&&)运算符

本文探讨在编程中，当需要根据一个布尔条件执行某个操作，而不需要显式else分支时，如何优雅地实现条件执行。我们将介绍并推荐使用逻辑与(&&)运算符进行短路求值，作为传统三元运算符`condition ? action() : false;`的简洁高效替代方案，提升代码可读性和表达力。…

程序猿
2025年12月21日
0000
用户投稿

优化 Jest 模拟：强制未实现函数抛出错误以提升测试效率

在使用 `jest-mock-extended` 进行单元测试时，未显式实现的模拟函数默认返回 `undefined`，这可能导致难以追踪的测试失败。本文将介绍如何利用 `jest-mock-extended` 的 `fallbackmockimplementation` 选项，为所有未实现的模拟函…

程序猿
2025年12月21日
0000
用户投稿

优化数组循环：PHP/JavaScript中for循环的最佳实践

本文探讨在php和javascript中优化`for`循环遍历数组的最佳实践。我们将重点讨论如何通过缓存数组长度来提升性能，以及如何通过使用描述性变量名和明智选择直接访问或局部变量赋值来增强代码的可读性和可维护性，同时澄清现代语言中这两种访问方式的性能差异。在软件开发中，循环遍历数组是常见的操作。…

程序猿
2025年12月21日
0000
用户投稿

MongoDB日期存储偏差：深入理解与解决时区转换问题

本文旨在解决向mongodb提交日期数据时可能出现的日期自动减一问题。通过分析javascript date对象在不同时区环境下的行为以及mongodb的utc存储机制，文章详细阐述了导致日期偏差的根本原因，并提供了基于utc存储、标准化客户端输入以及服务器端精确解析日期的最佳实践和具体代码示例，确…

程序猿
2025年12月21日
0000
用户投稿

解决React组件中回调函数未调用导致的测试失败问题

本文探讨了react组件中`oncancel`回调函数在测试中未能按预期触发的问题。核心原因在于组件接口定义了该回调，但在实际处理函数中并未显式调用。文章提供了详细的排查过程和修复方案，强调了在组件内部正确调用传入的回调函数的重要性，以确保组件行为与测试预期一致。在开发React应用时，我们经常需…

程序猿
2025年12月21日
1000
用户投稿

解决React组件中可选回调属性未调用导致的测试失败问题

本文探讨了react组件中一个常见的测试失败场景：当组件定义了一个可选的回调属性（如oncancel），但在其内部事件处理函数中未实际调用该属性时，相关的单元测试将失败。文章通过分析示例代码，详细解释了问题根源，并提供了在事件处理函数中正确调用该回调属性的解决方案，确保组件行为符合预期并使测试通过。…

程序猿
2025年12月21日
1000