Hibernate 6 升级后查询性能下降的排查与优化策略

本文深入探讨了将应用程序从 hibernate 5 升级到 hibernate 6 后，特定 select 查询可能出现的显著性能下降问题。通过分析性能瓶颈集中在 `listresultsconsumer.withduplicationcheck()` 方法，文章提供了两种有效的优化策略：使用 `getresultstream()` 处理查询结果，或通过查询元组绕过实体处理开销。旨在帮助开发者理解并解决 hibernate 6 升级中的查询性能挑战。

引言：Hibernate 6 升级中的查询性能挑战

随着技术栈的不断演进，将应用程序的持久层框架从 Hibernate 5 升级到 Hibernate 6 是一个常见的需求。然而，在升级过程中，开发者可能会遇到一些意料之外的性能问题。一个典型的案例是，在某些 SELECT 查询中，Hibernate 6 的执行速度相比 Hibernate 5 可能会慢上十倍甚至更多。

例如，在一个包含 500,000 个实体对象的简单应用中，使用 Hibernate 5 执行全表查询（FROM MyEntity）可能只需约 2.4 秒，而升级到 Hibernate 6 后，相同的查询可能耗时超过 35 秒。通过性能分析工具可以发现，Hibernate 6 的大部分时间（约 90%）都消耗在 org.hibernate.sql.results.spi.ListResultsConsumer.withDuplicationCheck() 方法中，这表明性能瓶颈在于结果集的后处理阶段，而非数据库查询本身。此问题已被 Hibernate 官方识别，并记录在 JIRA 问题 HHH-15133 中。

为了更好地理解和解决这个问题，我们将通过一个简化的示例来展示问题场景，并提供两种有效的优化策略。

问题场景示例

假设我们有一个简单的 JPA 实体 MyEntity：

package com.me;import jakarta.persistence.Entity;import jakarta.persistence.GeneratedValue;import jakarta.persistence.GenerationType;import jakarta.persistence.Id;@Entitypublic class MyEntity {    @Id    @GeneratedValue(strategy = GenerationType.AUTO)    protected Long id;    // ... 其他字段和方法}

以及一个用于测试的 Maven pom.xml 配置，其中可以切换 Hibernate 5 或 Hibernate 6 的依赖：

                            com.h2database            h2            2.1.214                            jakarta.xml.bind            jakarta.xml.bind-api            3.0.1                                    org.hibernate.orm            hibernate-core            6.1.5.Final                        <!--            org.hibernate            hibernate-core-jakarta            5.6.14.Final        -->

在应用程序中，我们执行一个简单的查询来获取所有 MyEntity 实例：

import org.hibernate.Session;import org.hibernate.cfg.Configuration;import java.util.List;import java.util.Properties;import org.hibernate.tool.schema.Action;import org.h2.Driver;public class MyApplication {    public static void main(final String[] args) {        // ... 配置 JPA 属性 ...        final Properties jpaProperties = new Properties();        jpaProperties.put("hibernate.connection.url", "jdbc:h2:mem:");        jpaProperties.put("jakarta.persistence.jdbc.driver", Driver.class.getName());        jpaProperties.put("jakarta.persistence.schema-generation.database.action", Action.CREATE);        try (Session session = new Configuration().addAnnotatedClass(MyEntity.class).addProperties(jpaProperties)                .buildSessionFactory().openSession()) {            session.beginTransaction();            // 插入 500,000 个 MyEntity 实例            // IntStream.range(0, 500000).mapToObj(i -> new MyEntity()).forEach(session::persist);            session.getTransaction().commit();            // 导致性能问题的查询            List entities = session.createQuery("FROM MyEntity", MyEntity.class).getResultList();            // ... 处理结果 ...        }    }}

当使用 Hibernate 6.1.5.Final 运行上述代码时，getResultList() 调用会显著变慢，其主要原因在于 Hibernate 6 在处理列表结果时引入的重复检查机制。

解决方案与优化策略

针对 Hibernate 6 中 getResultList() 导致的性能下降问题，目前有两种主要的有效工作方案。

闪念贝壳

闪念贝壳是一款AI 驱动的智能语音笔记，随时随地用语音记录你的每一个想法。

闪念贝壳 218 查看详情

策略一：利用 getResultStream() 优化查询结果处理

getResultStream() 方法返回一个 Stream 对象，允许以流式方式处理查询结果，而无需一次性将所有结果加载到内存并进行重复检查。这可以有效地避免 ListResultsConsumer.withDuplicationCheck() 方法带来的性能开销。

示例代码：

import java.util.List;import java.util.stream.Collectors;import java.util.stream.Stream;import org.hibernate.Session;// 假设 session 已经初始化并可用try (Stream stream = session.createQuery("FROM MyEntity", MyEntity.class).getResultStream()) {   // 如果仍然需要 List，可以在流处理后收集   List entities = stream.collect(Collectors.toList());   // ... 对 entities 进行操作}

通过将 getResultList() 替换为 getResultStream()，并根据需要将流收集为列表，可以显著提高查询性能。这种方法在大多数情况下都是首选，因为它更符合现代 Java 8+ 的编程范式，并且能够有效规避 Hibernate 6 的内部性能瓶颈。

策略二：查询元组 (Tuples) 而非实体

另一种方法是直接查询元组（Object[] 或 Tuple），而不是完整的实体对象。这种方式可以绕过 Hibernate 在构建实体对象列表时可能进行的某些复杂后处理和重复检查。

示例代码：

import java.util.List;import org.hibernate.Session;// 假设 session 已经初始化并可用List

Hibernate 6 升级后查询性能下降的排查与优化策略

引言：Hibernate 6 升级中的查询性能挑战

问题场景示例

解决方案与优化策略

策略一：利用 getResultStream() 优化查询结果处理

策略二：查询元组 (Tuples) 而非实体

注意事项与后续发展

总结

关于作者

相关推荐

发表回复