
在Java中开发类似PyTorch或Tensorflow的张量处理/深度学习库时,经常会遇到需要管理大量原生内存的情况。一个常见的问题是,程序会频繁创建小型Java对象,这些对象持有指向大型原生内存的句柄(MemoryHandle)。由于这些Java对象本身很小,即使原生内存被大量分配,JVM的堆内存占用可能仍然很低。这会导致垃圾回收器(GC)不会频繁启动,从而使得原生内存无法及时释放,最终导致应用程序的内存占用过高。
问题分析
这种问题通常具有以下特点:
高分配率的小对象: 频繁创建持有大型原生资源的Java小对象。复杂的对象引用关系: 对象之间存在复杂的引用关系,使得GC难以判断哪些对象可以安全回收。难以确定资源何时不再使用: 无法在代码中安全地确定原生资源何时不再被引用。
解决方案:异步GC触发机制
一种可行的解决方案是创建一个机制,允许异步地请求执行完整的垃圾回收。
import java.util.concurrent.atomic.AtomicBoolean;public class GCHelper { private final AtomicBoolean shouldRunGC = new AtomicBoolean(false); private final Thread gcThread = new Thread(() -> { while (true) { try { Thread.sleep(10); } catch (InterruptedException e) { e.printStackTrace(); } if (shouldRunGC.getAndSet(false)) { System.gc(); } } }, "GC-Invoker-Thread"); public GCHelper() { gcThread.setDaemon(true); gcThread.start(); } public void requestGC() { shouldRunGC.set(true); }}
这段代码创建了一个后台线程,该线程会定期检查shouldRunGC标志。如果该标志被设置为true,则会调用System.gc()来触发垃圾回收。
在代码中,选择一个与句柄对象清理密切相关的区域。这并不一定意味着此时可以安全地释放这些对象,而是表示这些对象可能可以安全地删除。这个调用点主要用于收集统计数据,以确定触发垃圾回收的最佳间隔。同时,需要了解原生资源的大小,或者估计保留给定对象可能造成的损失。
以下是一个示例,展示了如何在张量处理库中使用此机制:
灵云AI开放平台
灵云AI开放平台
150 查看详情
public class Tensor { private long numBytes; private GCHelper gcHelper; public Tensor(long numBytes, GCHelper gcHelper) { this.numBytes = numBytes; this.gcHelper = gcHelper; } public void dropHistory() { // ... 其他代码 ... nBytesDeletedSinceLastAsyncGC += numBytes; nBytesDeletedSinceLastOnSameThreadGC += numBytes; if (nBytesDeletedSinceLastAsyncGC > 100_000_000) { // 100 Mb gcHelper.requestGC(); nBytesDeletedSinceLastAsyncGC = 0; } if (nBytesDeletedSinceLastOnSameThreadGC > 2_000_000_000) { // 2 GB System.gc(); nBytesDeletedSinceLastOnSameThreadGC = 0; } }}
在这个例子中,dropHistory方法会在某些条件满足时触发异步和同步的垃圾回收。
JVM参数优化
为了避免阻塞分配循环,可以使用以下JVM参数:
-XX:+UseZGC -XX:+ExplicitGCInvokesConcurrent -XX:MaxGCPauseMillis=1
-XX:+UseZGC: 启用Z Garbage Collector (ZGC),一种低延迟的垃圾回收器。-XX:+ExplicitGCInvokesConcurrent: 允许System.gc()并发执行,减少阻塞。-XX:MaxGCPauseMillis=1: 设置最大GC暂停时间为1毫秒,进一步降低延迟。
原理解释
定期触发垃圾回收可以促使GC关注那些小型句柄对象,并尝试释放它们所引用的原生内存。尽管这种方法无法对句柄对象进行“优先级排序”,但它可以提高GC清理这些对象的可能性。如果应用程序除了句柄对象之外还分配了大量其他小型对象,则此技术的有效性可能会降低。
注意事项
触发垃圾回收的代价很高,因此必须仔细选择nBytesDeletedSinceLastAsyncGC和nBytesDeletedSinceLastOnSameThreadGC的最大值。异步运行垃圾回收的成本较低,因为它不会严重阻塞分配循环,但效果也比在分配对象的同一线程上调用垃圾回收要差。因此,以精心选择的间隔执行异步和同步垃圾回收,可以在分配循环的执行速度和内存占用之间取得良好的平衡。
总结
通过结合异步GC触发机制和JVM参数优化,可以在Java中有效地管理大型原生资源,避免内存泄漏问题,并提高应用程序的性能。需要注意的是,具体的参数值需要根据实际情况进行调整,以达到最佳效果。
以上就是高效GC辅助清理大型原生资源的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/750331.html
微信扫一扫
支付宝扫一扫