Java Stream API实践：避免共享可变性实现分批数据查询

程序猿 • 2025年11月6日 02:16:24 • 用户投稿 • 阅读 0

本文探讨了在Java中处理分批数据库查询时如何避免共享可变性问题。通过利用Java Stream API的map和flatMap操作，可以以函数式、不可变的方式收集数据，从而提升代码的线程安全性和可读性，尤其适用于需要将大列表拆分为小批次进行处理的场景。

引言：共享可变性带来的挑战

在实际的软件开发中，我们经常会遇到需要从数据库中批量获取数据的场景。然而，数据库通常会对单次查询的参数数量有所限制（例如，SQL IN子句的参数数量上限）。这意味着当我们需要查询大量ID对应的数据时，必须将这些ID列表进行分批处理，然后多次执行查询。

考虑以下Java代码示例，它试图解决分批查询的问题：

AtomicInteger counter = new AtomicInteger();List catList = new ArrayList();List dogList = new ArrayList();List numbers = Stream.iterate(1, e -> e + 1)    .limit(5000)    .collect(Collectors.toList());// 将大列表分割成大小为500的小批次Collection<List> partitionedListOfNumbers = numbers.stream()    .collect(Collectors.groupingBy(num -> counter.getAndIncrement() / 500))    .values();// 遍历每个批次并累加结果partitionedListOfNumbers.stream()    .forEach(list -> {        List interimCatList = catRepo.fetchCats(list); // 从数据库获取Cat        catList.addAll(interimCatList); // 修改外部的catList        List interimDogList = dogRepo.fetchDogs(list); // 从数据库获取Dog        dogList.addAll(interimDogList); // 修改外部的dogList    });

上述代码虽然实现了分批查询的功能，但存在一个关键问题：共享可变性（Shared Mutability）。在forEach循环内部，catList和dogList这两个外部列表被反复修改（通过addAll操作）。这种模式在单线程环境下可能不明显，但在多线程或并发环境中，可能会导致数据不一致、竞态条件等难以调试的错误。函数式编程鼓励使用不可变数据和无副作用的操作，以提高代码的健壮性和可预测性。

Java Stream API：函数式编程的解决方案

Java 8引入的Stream API提供了一种声明式、函数式的方式来处理集合数据，它强调数据流的转换而非直接修改。通过利用Stream API的map和flatMap操作，我们可以重构上述代码，彻底避免共享可变性问题。

立即学习“Java免费学习笔记（深入）”；

核心思想是：让每个批次查询操作返回其自身的结果列表，然后将所有这些结果列表“展平”并收集到一个全新的、不可变的结果列表中。

重构步骤与代码示例

为了更好地演示，我们首先定义一些辅助类和接口：

import java.util.*;import java.util.concurrent.atomic.AtomicInteger;import java.util.function.Function;import java.util.stream.Collectors;import java.util.stream.IntStream;import java.util.stream.Stream;// 模拟数据库查询接口interface CatRepo {    List fetchCats(List keys);}interface DogRepo {    List fetchDogs(List keys);}// 示例实体类class Cat {    int id;    String name;    public Cat(int id) { this.id = id; this.name = "Cat-" + id; }    @Override public String toString() { return "Cat{id=" + id + ", name='" + name + "'}"; }}class Dog {    int id;    String name;    public Dog(int id) { this.id = id; this.name = "Dog-" + id; }    @Override public String toString() { return "Dog{id=" + id + ", name='" + name + "'}"; }}// 模拟数据库查询实现class MockCatRepo implements CatRepo {    @Override    public List fetchCats(List keys) {        // 模拟数据库延迟        // try { Thread.sleep(10); } catch (InterruptedException e) { Thread.currentThread().interrupt(); }        return keys.stream().map(Cat::new).collect(Collectors.toList());    }}class MockDogRepo implements DogRepo {    @Override    public List fetchDogs(List keys) {        // 模拟数据库延迟        // try { Thread.sleep(10); } catch (InterruptedException e) { Thread.currentThread().interrupt(); }        return keys.stream().map(Dog::new).collect(Collectors.toList());    }}

现在，我们使用Stream API来重构核心逻辑。

1. 生成并分批处理键列表

首先，我们需要生成一个包含所有待查询ID的列表，并将其分割成多个小批次。这里我们使用IntStream.rangeClosed生成整数序列，并结合Collectors.groupingBy进行分批。

// 初始化模拟仓库CatRepo catRepo = new MockCatRepo();DogRepo dogRepo = new MockDogRepo();AtomicInteger counter = new AtomicInteger();int BATCH_SIZE = 500;int TOTAL_NUMBERS = 5000; // 模拟5000个ID// 生成1到5000的整数，并按BATCH_SIZE进行分批Collection<List> partitionedListOfNumbers = IntStream.rangeClosed(1, TOTAL_NUMBERS)    .boxed() // 将IntStream转换为Stream    .collect(Collectors.groupingBy(num -> counter.getAndIncrement() / BATCH_SIZE))    .values(); // 获取所有分批后的子列表集合

在这个步骤中，AtomicInteger在这里的作用是为每个元素生成一个递增的索引，然后通过index / BATCH_SIZE将元素分配到不同的组中，从而实现批次划分。

2. 使用map和flatMap进行数据获取与合并

现在，我们可以利用Stream API的强大功能来并行或顺序地处理这些批次，并以不可变的方式收集结果。

map操作： 对partitionedListOfNumbers中的每一个List（即一个批次）调用fetchCats或fetchDogs方法。map操作会返回一个Stream<List>或Stream<List>，即一个包含多个列表的流。flatMap操作： flatMap用于将Stream<List>展平为Stream。它会将流中的每个内部列表展开，并将其所有元素合并到一个新的单一流中。collect(Collectors.toList())： 最后，将展平后的流中的所有元素收集到一个新的List中。这个新的列表是不可变的，因为它是在所有操作完成后一次性构建的。

// 获取Cat列表List catList = partitionedListOfNumbers.stream()    .map(catRepo::fetchCats)      // 对每个批次调用fetchCats，得到 Stream<List>    .flatMap(Collection::stream)  // 将 Stream<List> 展平为 Stream    .collect(Collectors.toList());// 收集到最终的 List// 获取Dog列表List dogList = partitionedListOfNumbers.stream()    .map(dogRepo::fetchDogs)      // 对每个批次调用fetchDogs，得到 Stream<List>    .flatMap(Collection::stream)  // 将 Stream<List> 展平为 Stream    .collect(Collectors.toList());// 收集到最终的 List// 打印结果（可选）// System.out.println("Fetched Cats: " + catList.size());// System.out.println("Fetched Dogs: " + dogList.size());// System.out.println("First Cat: " + (catList.isEmpty() ? "N/A" : catList.get(0)));// System.out.println("Last Cat: " + (catList.isEmpty() ? "N/A" : catList.get(catList.size() - 1)));

通过这种方式，我们完全避免了对外部可变列表的直接修改。catList和dogList在声明时即被初始化，并在所有数据处理完成后，通过collect操作一次性赋值，确保了其不可变性。

优化：抽象通用查询逻辑

观察上述代码，catList和dogList的生成逻辑高度相似，唯一的区别在于调用的fetch方法。我们可以进一步抽象出一个通用方法来减少代码重复：

/** * 通用方法：根据分批的键列表和查询函数，批量获取数据并合并。 * @param partitionedKeys 分批的键列表 * @param fetchFunction 每个批次对应的查询函数（例如：catRepo::fetchCats） * @param  返回结果的类型 * @return 包含所有查询结果的合并列表 */public static  List fetchAnimalsInBatches(        Collection<List> partitionedKeys,        Function<List, List> fetchFunction) {    return partitionedKeys.stream()        .map(fetchFunction)          // 应用传入的查询函数        .flatMap(Collection::stream) // 展平结果        .collect(Collectors.toList());// 收集到最终列表}// 如何使用这个通用方法List catListOptimized = fetchAnimalsInBatches(partitionedListOfNumbers, catRepo::fetchCats);List dogListOptimized = fetchAnimalsInBatches(partitionedListOfNumbers, dogRepo::fetchDogs);// System.out.println("Optimized Fetched Cats: " + catListOptimized.size());// System.out.println("Optimized Fetched Dogs: " + dogListOptimized.size());

这个通用方法极大地提高了代码的复用性和可维护性，使得我们可以用更简洁的方式处理不同类型的数据查询。

注意事项与最佳实践

不可变性与线程安全： 这种基于Stream API的方案天然地避免了共享可变性，使得代码在多线程环境下更加安全，不易出现竞态条件。资源管理： Stream API本身不直接管理数据库连接等外部资源。fetchCats和fetchDogs内部的数据库操作仍需遵循标准的资源管理（如使用try-with-resources）。错误处理： 数据库查询方法（如fetchCats）内部应包含适当的错误处理逻辑。如果查询可能抛出受检异常，map操作需要进行相应的处理（例如，通过包装成RuntimeException或使用Try monad等）。性能考量： 对于极大规模的数据集，Stream操作可能引入一定的内存或CPU开销。但对于常见的数据库分批查询场景，其性能通常是可接受且高效的。如果需要最大化性能，可以考虑使用parallelStream()，但这会增加并发复杂性，并需要确保fetchFunction是线程安全的。分批策略： 示例中使用AtomicInteger和groupingBy进行分批，这是一种有效的手段。此外，也可以使用如Guava库中的Lists.partition方法来更简洁地实现列表分批。可读性： 函数式编程风格的代码通常更简洁、意图更明确，提高了代码的可读性。

总结

通过本教程，我们学习了如何利用Java Stream API的map和flatMap操作，以函数式、不可变的方式解决分批数据库查询中的共享可变性问题。这种方法不仅提升了代码的线程安全性，还使得代码更加简洁、可读性更强。在处理集合数据时，拥抱Stream API和函数式编程范式，能够帮助我们编写出更健壮、更易于维护的Java应用程序。

以上就是Java Stream API实践：避免共享可变性实现分批数据查询的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/39400.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

数据中心维护的未来发展

上一篇 2025年11月6日 02:16:04

AWE 2025 揭幕日：爱攻电竞显示器重塑豪华 MPV，开启移动电竞新纪元！

下一篇 2025年11月6日 02:17:25

好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
1000
如何在网页 F12 调试中查看鼠标悬停时才出现的 DOM 元素？

如何在网页 f12 调试中查看鼠标悬停时才出现的 dom 元素？在 f12 调试模式下，鼠标悬停时才出现的 dom 元素无法通过直接选择查看。解决方法根据显示原理的不同而有所区别： 1. css 控制的元素强制开启悬停状态：在 firefox 浏览器中，可以通过在开发者工具中手动开启选中元素的 …

程序猿
2025年12月24日 • 好文分享
2000
好文分享

TDesign UI库中小程序开发的CSS选择器：为什么“.t-grid–card”能生效？

TDesign UI库中CSS选择器困惑在小程序开发中，使用TDesign UI库时，您可能会遇到一个困惑的CSS选择器。例如，在DOM结构中，一个元素的class为”t-grid t-card class t-class”, 但其CSS选择器却是”&#8216…

程序猿
2025年12月24日
1000
好文分享

逻辑属性与旧版属性：如何根据文本方向选择合适的CSS属性？

CSS 逻辑属性与旧版属性 CSS 中引入了逻辑属性和旧版属性的概念。这些属性负责控制页面元素的外观和布局。逻辑属性逻辑属性以逻辑方向命名，如左右、上下。它们根据元素在文档流中的位置来确定元素的外观。例如：立即学习“前端免费学习笔记（深入）”； marginBlockStart：控制元素在垂直…

程序猿
2025年12月24日
1000
好文分享

CSS 逻辑属性和旧版属性：如何选择？

css逻辑属性与旧版属性 css中，逻辑属性和旧版属性用于控制元素的布局和外观。然而，两者在语法和使用方式上有所不同。逻辑属性逻辑属性是基于元素在现实世界中的预期行为来命名的。它使用诸如 “start”、”end” 和 “block&#…

程序猿
2025年12月24日
2000
好文分享

您不需要 CSS 预处理器

原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中，我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因，并向您展示如何使用原生 css 完成这些相同的事情。分隔文件分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

程序猿
2025年12月24日
1000
好文分享

动态样式类名为何失效：嵌套与并列选择器的区别在哪里？

动态样式类名不起作用：嵌套与并列问题在使用动态样式类名时，有时会遇到尽管触发事件但样式却没有改变的情况。这可能是由于使用了后代选择器而造成的。以提供的代码为例：块中，嵌套的类是content类的后代。这意味着类仅在元素包含子元素时才能生效。为了解决这个问题，需要将与类编写为并列，而不是嵌套方…

程序猿
2025年12月24日
3000
好文分享

CSS 定位属性：六种定位方式的区别是什么？

CSS中的定位属性及其区别 CSS中的 position 属性定义元素的定位行为，它共有六个可供选择的属性值，分别是：静态定位 (static)：默认值，元素按照正常文档流进行定位。相对定位 (relative)：元素相对于自身原本的位置进行偏移。绝对定位 (absolute)：元素相对于最近的非…

程序猿
2025年12月24日
1000
好文分享

父元素仅设置 Line-height 对子元素高度的影响：行内块级元素与块级元素有什么区别？

父元素仅设置 Line-height 对子元素的块级或行内块级元素的影响当父元素只设置了 Line-height 而没有设置高度时，对其子元素的影响将取决于子元素的类型。如果子元素是行内块级元素，如 inine-block，父元素的 Line-height 将成为子元素的高度。这是因为行内块级元…

程序猿
2025年12月24日
1000
好文分享

当父元素仅设置行高时，块级和行内块级元素的行为有何区别？

当父元素仅设置行高时，块级或行内块级子元素的行为在 html 中，当父元素仅设置行高 line-height 时，块级或行内块级元素的行为会有所不同。 <line-height: 60px; background-color: antiquewhite; 哈哈哈行内块级元素（display…

程序猿
2025年12月24日
3000
好文分享

为什么将perspective样式设置在带有transform-style: preserve-3d样式的元素的父级元素上才能得到预期的3D变换效果？

perspective必须设置在带有transform style: preserve-3d样式的元素的父级元素上吗？问题：你的HTML和CSS代码中，将perspective样式设置在了.scene元素上，当你将其移动到.cube元素后，效果却发生了变化。这是为什么？解答： perspect…

程序猿
2025年12月24日
0000
好文分享

perspective属性设置在父元素和后代元素上，对3D效果有什么区别？

perspective属性的位置对3d效果的影响通常情况下，perspective属性需要设置在应用了transform-style: preserve-3d属性的父元素上。然而，如果perspective属性设置在后代元素上会产生不同的效果。为了演示区别，让我们扩展已有的示例： front b…

程序猿
2025年12月24日
0000
好文分享

CSS perspective 属性，设置在不同元素上会产生什么区别？

perspective 属性在不同元素上的效果对比 CSS 中的 perspective 属性用于指定 3D 转换的视角距离。它可以通过改变物体相对于观察者的远近距离来创建三维效果。然而，将 perspective 设置在不同的元素上会产生不同的效果。根据提供的代码，我们将 perspective…

程序猿
2025年12月24日
0000
好文分享

## PostCSS vs. Sass/Less/Stylus：如何选择合适的 CSS 代码编译工具？

PostCSS 与 Sass/Less/Stylus：CSS 代码编译转换中的异同在 CSS 代码的编译转换领域，PostCSS 与 Sass/Less/Stylus 扮演着重要的角色，但它们的作用却存在细微差异。区别 PostCSS 主要是一种 CSS 后处理器，它在 CSS 代码编译后进行处…

程序猿
2025年12月24日
0000
好文分享

CSS flex 布局中 justify-content 的 flex-start 和 start 的区别是什么？

CSS flex 中 justify-content 的 flex-start 和 start 的区别在 CSS flex 布局中，justify-content 属性用于控制子元素在主轴上的对齐方式。其中，flex-start 和 start 似乎是相同的，但实际上它们有微妙的区别。定义根据…

程序猿
2025年12月24日
0000
好文分享

css flex 中 justify-content 的 flex-start 和 start 可互换吗？

CSS flex 中 justify-content 的 flex-start 和 start 区别解析 MDN 文档上似乎没有提及 start 和 flex-start 在 justify-content 中的区别，但 post-css 插件却会对此发出警告。本文将对此进行解析。虽然在官方规范中…

程序猿
2025年12月24日
0000
好文分享

“flex-start”和“start”在 CSS Flex 中有何差异？

深入剖析 CSS Flex 中 justify-content 的 start 和 flex-start 在 CSS 的 flex 布局中，justify-content 属性控制子元素在主轴上的对齐方式，其中包含两个值：”flex-start” 和 “start…

程序猿
2025年12月24日
0000
好文分享

在 CSS flex 布局中，justify-content: flex-start 和 justify-content: start 的区别是什么？

CSS flex 的 justify-content：flex-start 与 start 的区别你是否注意到 post-css 插件会对使用 start 替代 flex-start 提出警告？本文将深入探索 flex-start 与 start 在 CSS flex 中的实际区别。定义上的差异…

程序猿
2025年12月24日
0000
好文分享

Vue 中控制子组件渲染：v-if 和 visible 哪个不导致组件销毁？

vue 通过 props 中的值控制子组件根元素中的 v-if 时, 子组件页面的渲染机制在 vue 中，通过 props 中的值控制子组件根元素中的 v-if, 可实现子组件的显示和隐藏。对于不同的控制方式，组件页面渲染机制也不同。方案 1: 使用 v-if 控制在 v-if 为 false…

程序猿
2025年12月24日
0000
好文分享

CSS中相对单位和绝对单位有何异同？

CSS（层叠样式表）是一种用于描述网页上元素样式的标记语言。在CSS中，有两种不同的长度单位，分别是相对单位和绝对单位。相对单位是相对于元素自身或其父元素的大小来计算的。常见的相对单位有：百分比（%）、em和rem。百分比单位是相对于父元素的大小来计算的。例如，如果父元素的宽度为400px，子元…

程序猿
2025年12月24日
1000