详解Java线程本地握手机制实现安全点暂停的原理

程序猿 • 2025年11月4日 07:49:33 • java • 阅读 1

线程本地握手（tlh）是jvm中用于实现安全点暂停的高效机制，其核心在于允许jvm按需主动通知特定线程暂停而非全局停顿。1. tlh通过向目标线程发送“握手请求”而非依赖线程轮询全局标志，实现更细粒度的控制；2. 线程仅在安全点响应请求暂停，未参与操作的线程可继续执行，减少全局停顿时间；3. 该机制改善了jni/native代码的兼容性，提升jvm内部操作的并发性与响应性；4. 相较传统机制，tlh降低了应用的平均和最大停顿时间，但同时也带来了实现复杂度、jni边界限制、微观性能开销及调试难度等挑战。

Java线程本地握手（Thread-Local Handshake, TLH）机制，是JVM实现安全点暂停的一种更精细、高效的策略。简单来说，它允许JVM在需要进行垃圾回收或其他全局操作时，不是粗暴地“停止所有线程”，而是更智能地、按需地“通知”单个Java线程在它们方便的时候暂停自己，从而显著减少全局停顿时间，提升应用响应性。

解决方案

要理解线程本地握手，我们得先稍微回顾一下JVM的安全点（Safepoint）是个什么概念。安全点是JVM内部的一个关键同步机制，它确保在执行某些全局性操作（比如垃圾回收、JIT编译优化、代码热替换等）时，所有Java线程都处于一个“安全”且可被检查的状态。这意味着线程不能在任意指令处被暂停，它必须暂停在一个特定的、JVM能够安全地识别其栈帧、寄存器等信息的位置。

在TLH出现之前，JVM通常采用一种“协作式”的轮询机制来达到安全点。线程会在循环回边、方法调用、异常处理等特定位置插入检查点，不断地“问”JVM：“我需要暂停吗？”当JVM需要进入安全点时，它会设置一个全局标志，所有线程在下一次检查时发现这个标志，就会自行暂停。这种方式虽然简单，但有个明显的缺点：如果某个线程长时间运行在没有检查点的代码（比如一个紧密的计算循环，或者长时间停留在原生方法中），它就无法及时响应暂停请求，从而拖延了整个JVM进入安全点的时间，导致全局停顿（Stop-The-World, STW）时间过长。

立即学习“Java免费学习笔记（深入）”；

线程本地握手机制的出现，就是为了解决这个痛点。它不再完全依赖线程的“自觉”轮询，而是转变为一种更主动、更“命令式”的通知。

它的工作原理大致是这样：JVM需要触发一个安全点操作时，会向目标Java线程发送一个“握手请求”。这个请求通常是通过向线程对象内部的某个特定内存地址写入一个标志位来实现的。每个Java线程在执行过程中，会周期性地（但频率远低于传统轮询）检查这个标志位，或者说，JVM通过一种异步的方式（比如发送信号，或者更常见的是，利用操作系统层面的机制来中断线程执行并注入检查逻辑）来通知线程。

当线程收到这个“握手请求”后，它会检查自己当前的状态。如果它正处于一个“安全”的位置（比如不在原生方法中，没有持有重要的锁，或者即将进入/退出一个方法），它就会立即暂停自己，并向JVM发送一个“已暂停”的确认。如果线程当前不处于安全点（比如正在执行一段无法中断的原生代码），它会继续执行，直到它到达下一个安全点（例如从原生方法返回Java代码，或者执行到方法入口/出口）时，再响应请求并暂停。

最关键的一点是，这种暂停是“线程本地”的。这意味着JVM可以只选择性地暂停那些需要暂停的Java线程，而其他线程（比如那些正在执行原生代码的线程，或者根本不需要参与GC的辅助线程）可以继续运行，从而极大地减少了全局停顿的范围和时间。JVM等待所有被请求暂停的线程都确认暂停后，就可以安全地执行全局操作了。

为什么需要线程本地握手？它解决了什么痛点？

在我看来，线程本地握手机制的引入，简直是JVM在追求极致性能和响应性方面的一个里程碑。它主要解决了以下几个核心痛点：

首先，也是最直观的，是全局停顿粒度过粗的问题。传统的安全点机制，一旦需要GC，那基本上是“一刀切”，所有Java线程都得停下来。这就像一家工厂要进行设备维护，结果所有生产线，无论是否需要维护，都必须停工。在现代高并发、低延迟的应用场景下，哪怕是几十毫秒的全局停顿，也可能导致用户体验显著下降，甚至引发连锁反应。TLH的出现，让JVM能够更“精准打击”，只暂停那些真正需要暂停的线程，其他线程可以继续跑，这对于减少应用不可用时间至关重要。

其次，它极大地改善了JNI/Native代码的兼容性与效率。以前，如果一个Java线程长时间陷在JNI调用的原生代码里，它就无法触及到JVM的轮询点，从而导致整个JVM无法进入安全点，所有其他线程都得干等着。这在某些IO密集型或计算密集型、大量使用JNI的场景下简直是噩梦。TLH改变了这种被动等待的局面，JVM可以主动地向这些线程“喊话”，即使线程在原生代码里，当它返回Java时，也能立即响应并暂停。虽然长时间的原生调用依然是个挑战，但至少机制上变得更灵活了。

再者，它提升了JVM内部操作的并发性。当某些JVM内部操作（比如偏向锁撤销、JIT编译优化等）需要部分线程暂停时，TLH允许这些操作在不影响其他无关线程的情况下进行。这使得JVM的“后台工作”能够更加平滑地进行，减少了对应用主线的干扰。

智谱清言 – 免费全能的AI助手

2 查看详情

最后，从性能开销上看，虽然TLH本身也有一定的开销，但它通过减少全局停顿的频率和持续时间，整体上降低了应用的总停顿时间。它把原本集中且粗暴的停顿，分散成了更短、更局部的“微暂停”，让应用看起来更流畅，响应性更好。这就像以前是每小时停电十分钟，现在是每分钟闪烁一下，虽然总时间可能差不多，但用户感受完全不同。

线程本地握手与传统安全点机制有何不同？

线程本地握手和传统安全点机制在实现原理和哲学上有着本质的区别，这使得TLH在现代JVM中扮演了越来越重要的角色。

最核心的不同在于主动性与被动性。传统的安全点机制，更像是一种“被动协作”：JVM设置一个全局标志，然后等待所有Java线程“自觉”地在它们执行到特定的安全点检查位置时发现这个标志并暂停。这是一种“拉取（pull）”模型，线程主动去检查。而线程本地握手则更像是一种“主动通知”：当JVM需要某个或某些线程暂停时，它会主动向这些线程发送一个“暂停请求”，线程收到请求后才进行响应。这更接近于一种“推送（push）”模型。

其次是暂停的粒度。传统机制通常是“全局暂停”（Stop-The-World），JVM一旦决定进入安全点，所有Java线程都必须暂停。这就像按了一个总开关，所有灯都灭了。而TLH则实现了“局部暂停”或“按需暂停”。JVM可以只选择性地暂停那些需要暂停的线程，例如，如果一个GC操作只关心年轻代，那么那些长时间在老年代活动且不涉及年轻代的线程可能就无需暂停，或者可以延迟暂停。这就像只关了厨房的灯，客厅的灯还亮着，效率高多了。

再者，实现机制的差异也很显著。传统机制依赖于编译器在代码中插入大量的“安全点轮询指令”，这些指令会不断检查一个全局变量。这在一定程度上会增加代码的执行路径和分支预测的压力。TLH则通常利用操作系统提供的机制（比如信号，或者更轻量级的，通过修改线程对象内部的特定内存地址，并让线程在关键路径上检查这个地址），来更高效、更直接地通知线程。这种方式减少了频繁的轮询开销，也让JVM对线程的控制力更强。

最后，从对应用性能的影响来看，传统机制的全局停顿，其持续时间往往直接受到最慢响应线程的限制。一个“顽固不化”的线程就能拖慢整个JVM。而TLH通过更精细的控制和更快的响应机制，大大缩短了达到安全点的总时间，从而显著降低了应用程序的平均和最大停顿时间。这种优化对于追求低延迟、高吞吐量的应用来说，是实打实的性能提升。

线程本地握手在实际应用中可能遇到的挑战或限制？

虽然线程本地握手机制带来了诸多优势，但在实际应用和JVM的实现中，它也并非万能，或者说，它引入了一些新的复杂性和挑战。

一个比较明显的挑战是实现复杂度的提升。相较于简单的全局轮询，TLH机制的实现要复杂得多。它涉及到JVM与操作系统底层机制的交互（比如如何高效地向特定线程发送信号或修改其状态），以及线程内部如何快速、安全地响应这些请求。这需要JVM开发团队投入大量精力进行精细的设计和优化，以确保其稳定性和性能。任何一点实现上的瑕疵，都可能导致意想不到的bug，比如死锁、性能倒退，甚至JVM崩溃。

另一个实际的限制是JNI/Native代码的边界问题依然存在。尽管TLH改善了JNI的兼容性，但如果一个Java线程长时间地在原生代码中执行，并且这段原生代码本身并没有提供任何机会让线程返回Java（或者没有显式的JNI安全点检查），那么这个线程依然可能成为“顽固分子”，拖延全局安全点的到来。JVM需要额外的机制（比如JNI Critical区域的特殊处理，或者在JNI方法入口/出口处强制进行安全点检查）来应对这种情况。这要求开发者在使用JNI时也要注意代码结构，避免长时间阻塞在原生方法中。

此外，微观层面的性能开销权衡也是一个需要考虑的问题。虽然TLH旨在减少全局停顿，但其自身的机制，比如JVM向线程写入状态、线程检查状态、以及可能涉及的上下文切换或信号处理，都会带来一定的CPU和内存开销。这些开销在单个线程上可能微不足道，但在高并发场景下，如果频繁触发TLH，累积起来也可能变得可观。JVM需要不断地优化这些操作，找到一个最佳的平衡点，确保收益大于成本。

最后，从调试和可观测性的角度看，TLH的引入可能会让某些问题变得更难追踪。当一个线程被TLH机制暂停时，它可能是在一个看似“随机”的位置被中断的，这对于传统的调试器来说，理解线程的上下文和暂停原因会更复杂。JVM的诊断工具也需要相应地升级，以提供更详细、更精确的线程状态信息，帮助开发者理解安全点暂停的发生时机和原因。这就像以前是所有人都站着不动，你一眼就能看清谁没动；现在是大家都在跑，只有少数人被喊停，你得更仔细地观察才能知道谁被停了，为什么被停。

以上就是详解Java线程本地握手机制实现安全点暂停的原理的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/257078.html

java线程为什么区别同步机制安全点暂停工具操作系统

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

反射调用方法的异常处理：InvocationTargetException如何解包真实异常？

上一篇 2025年11月4日 07:44:53

如何避免ConcurrentModificationException？

下一篇 2025年11月4日 07:50:07

好文分享

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
9000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 好文分享
4000
好文分享

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
0000
好文分享

为什么我的特定 DIV 在 Edge 浏览器中无法显示？

特定 DIV 无法显示：用户代理样式表的困扰当你在 Edge 浏览器中打开项目中的某个 div 时，却发现它无法正常显示，仔细检查样式后，发现是由用户代理样式表中的 display none 引起的。但你疑问的是，为什么会出现这样的样式表，而且只针对特定的 div？背后的原因用户代理样式表是由…

程序猿
2025年12月24日
2000
好文分享

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
0000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

为什么使用 inline-block 元素时会错位？

inline-block 元素错位成因剖析在使用 inline-block 元素时，可能会遇到它们错位显示的问题。如代码 demo 所示，当设置了 overflow 属性时，a 标签就会错位下沉，而未设置时却不会。问题根源： overflow:hidden 属性影响了 inline-block …

程序猿
2025年12月24日
0000
好文分享

为什么我的 CSS 元素放大效果无法正常生效？

css 设置元素放大效果的疑问解答原提问者在尝试给元素添加 10em 字体大小和过渡效果后，未能在进入页面时看到放大效果。探究发现，原提问者将 CSS 代码直接写在页面中，导致放大效果无法触发。解决办法如下：将 CSS 样式写在一个单独的文件中，并使用标签引入该样式文件。这个操作与原提问者观…

程序猿
2025年12月24日
0000
好文分享

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
1000
好文分享

为什么在父元素为inline或inline-block时，子元素设置width: 100%会出现不同的显示效果？

width:100%在父元素为inline或inline-block下的显示问题问题提出当父元素为inline或inline-block时，内部元素设置width:100%会出现不同的显示效果。以代码为例：测试内容这是inline-block span 效果1：父元素为inline-bloc…

程序猿
2025年12月24日
4000
好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
0000
如何在网页 F12 调试中查看鼠标悬停时才出现的 DOM 元素？

如何在网页 f12 调试中查看鼠标悬停时才出现的 dom 元素？在 f12 调试模式下，鼠标悬停时才出现的 dom 元素无法通过直接选择查看。解决方法根据显示原理的不同而有所区别： 1. css 控制的元素强制开启悬停状态：在 firefox 浏览器中，可以通过在开发者工具中手动开启选中元素的 …

程序猿
2025年12月24日 • 好文分享
1000
好文分享

TDesign UI库中小程序开发的CSS选择器：为什么“.t-grid–card”能生效？

TDesign UI库中CSS选择器困惑在小程序开发中，使用TDesign UI库时，您可能会遇到一个困惑的CSS选择器。例如，在DOM结构中，一个元素的class为”t-grid t-card class t-class”, 但其CSS选择器却是”&#8216…

程序猿
2025年12月24日
0000
好文分享

逻辑属性与旧版属性：如何根据文本方向选择合适的CSS属性？

CSS 逻辑属性与旧版属性 CSS 中引入了逻辑属性和旧版属性的概念。这些属性负责控制页面元素的外观和布局。逻辑属性逻辑属性以逻辑方向命名，如左右、上下。它们根据元素在文档流中的位置来确定元素的外观。例如：立即学习“前端免费学习笔记（深入）”； marginBlockStart：控制元素在垂直…

程序猿
2025年12月24日
0000
好文分享

CSS 逻辑属性和旧版属性：如何选择？

css逻辑属性与旧版属性 css中，逻辑属性和旧版属性用于控制元素的布局和外观。然而，两者在语法和使用方式上有所不同。逻辑属性逻辑属性是基于元素在现实世界中的预期行为来命名的。它使用诸如 “start”、”end” 和 “block&#…

程序猿
2025年12月24日
4000
好文分享

您不需要 CSS 预处理器

原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中，我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因，并向您展示如何使用原生 css 完成这些相同的事情。分隔文件分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

程序猿
2025年12月24日
0000
好文分享

动态样式类名为何失效：嵌套与并列选择器的区别在哪里？

动态样式类名不起作用：嵌套与并列问题在使用动态样式类名时，有时会遇到尽管触发事件但样式却没有改变的情况。这可能是由于使用了后代选择器而造成的。以提供的代码为例：块中，嵌套的类是content类的后代。这意味着类仅在元素包含子元素时才能生效。为了解决这个问题，需要将与类编写为并列，而不是嵌套方…

程序猿
2025年12月24日
2000
好文分享

CSS 定位属性：六种定位方式的区别是什么？

CSS中的定位属性及其区别 CSS中的 position 属性定义元素的定位行为，它共有六个可供选择的属性值，分别是：静态定位 (static)：默认值，元素按照正常文档流进行定位。相对定位 (relative)：元素相对于自身原本的位置进行偏移。绝对定位 (absolute)：元素相对于最近的非…

程序猿
2025年12月24日
0000
好文分享

父元素仅设置 Line-height 对子元素高度的影响：行内块级元素与块级元素有什么区别？

父元素仅设置 Line-height 对子元素的块级或行内块级元素的影响当父元素只设置了 Line-height 而没有设置高度时，对其子元素的影响将取决于子元素的类型。如果子元素是行内块级元素，如 inine-block，父元素的 Line-height 将成为子元素的高度。这是因为行内块级元…

程序猿
2025年12月24日
0000
好文分享

当父元素仅设置行高时，块级和行内块级元素的行为有何区别？

当父元素仅设置行高时，块级或行内块级子元素的行为在 html 中，当父元素仅设置行高 line-height 时，块级或行内块级元素的行为会有所不同。 <line-height: 60px; background-color: antiquewhite; 哈哈哈行内块级元素（display…

程序猿
2025年12月24日
2000