Java Stream 多字段分组与数值汇总教程

程序猿 • 2025年11月12日 15:23:21 • 用户投稿 • 阅读 0

本教程详细讲解如何使用 Java 8 Stream API 处理 List 类型数据，实现基于多个指定字段（索引 0、1、3、5）进行分组，并对另一指定字段（索引 6）的数值进行汇总。文章通过自定义键对象（Key 类或 record）来优化分组逻辑，避免复杂的嵌套 groupingBy，最终将结果转换回 List 格式，并提供代码示例及最佳实践建议。

引言

在数据处理中，我们经常需要对集合中的元素进行分组和聚合操作。当数据以非结构化的 string[] 数组形式存在，并且分组条件涉及数组中的多个元素时，传统的 collectors.groupingby 可能会变得复杂，尤其是在需要将聚合结果重新格式化为原始数据结构时。本教程将展示如何利用自定义键对象（key）结合 java stream api，优雅地解决这一问题。

假设我们有一个 List，其中每个 String[] 代表一行数据，包含多个字符串字段。我们的目标是：

根据数组中特定位置的元素（例如，索引 0、1、3 和 5）进行分组。对每个分组内，将另一个特定位置的元素（例如，索引 6）解析为数值并进行求和。最终生成一个新的 List，其中每个数组代表一个分组的聚合结果。

初始数据结构与需求

考虑以下 List 示例数据：

List dataLines = List.of(    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "84M", "-101.87", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-102.48", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "60M", "-103.75", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-10.8", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "60M", "-110.39", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-10.8", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "CZK", "12670012.4055", "60M", "-103.75", "0"},    new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4066", "20M", "-10.8", "0"});

我们希望根据 0th、1st、3rd 和 5th 元素相同的规则进行分组，并对 6th 元素（表示金额）进行求和。最终输出的 List 应包含每个分组的聚合结果，例如：

["2002","BRBTSS","BRSTNCNTF212","BRL","12670012.4055","84M","-101.87","0"],["2002","BRBTSS","BRSTNCNTF212","BRL","12670012.4055","120M","-124.08000000000001","0"], // 原始3个120M的数据汇总["2002","BRBTSS","BRSTNCNTF212","BRL","12670012.4055","60M","-214.14","0"], // 原始2个60M的数据汇总["2002","BRBTSS","BRSTNCNTF212","CZK","12670012.4055","60M","-103.75","0"],["2002","BRBTSS","BRSTNCNTF212","BRL","12670012.4066","20M","-10.8","0"]

直接使用多层 Collectors.groupingBy 会生成一个深度嵌套的 Map 结构，这虽然能完成分组和求和，但将其扁平化并转换回 List 会非常繁琐。

立即学习“Java免费学习笔记（深入）”；

解决方案：自定义键对象

为了更优雅地实现多字段分组，我们可以创建一个自定义的键对象（Key 类或 Java 16+ 的 record），它封装了所有用于分组的字段，并正确实现 equals() 和 hashCode() 方法。Collectors.groupingBy 内部依赖这两个方法来识别“相同”的键。

1. 定义 Key 对象

我们将使用 record 来实现 Key，因为它提供了简洁的语法来自动生成构造函数、访问器、equals() 和 hashCode() 方法。如果您的 Java 版本低于 16，可以使用普通的 class 实现。

使用 Java 16+ record:

import java.util.Objects;public record Key(String s0, String s1, String s2, String s3, String s4, String s5, String s7) {    // 辅助构造函数，方便从 String[] 创建 Key 实例    public Key(String[] line) {        this(line[0], line[1], line[2], line[3], line[4], line[5], line[7]);    }    // 重新定义 equals 方法，只比较用于分组的字段 (s0, s1, s3, s5)    @Override    public boolean equals(Object o) {        if (this == o) return true;        if (o == null || getClass() != o.getClass()) return false;        Key key = (Key) o;        return Objects.equals(s0, key.s0) && Objects.equals(s1, key.s1) && Objects.equals(s3, key.s3) && Objects.equals(s5, key.s5);    }    // 重新定义 hashCode 方法，只包含用于分组的字段 (s0, s1, s3, s5)    @Override    public int hashCode() {        return Objects.hash(s0, s1, s3, s5);    }    // 将 Key 对象和聚合后的 s6 值转换回 String[]    public String[] toArray(Double s6) {        return new String[]{s0, s1, s2, s3, s4, s5, String.valueOf(s6), s7};    }}

使用 Java class (兼容所有版本):

import java.util.Objects;public class Key {    private final String s0;    private final String s1;    private final String s2;    private final String s3;    private final String s4;    private final String s5;    private final String s7;    public Key(String s0, String s1, String s2, String s3, String s4, String s5, String s7) {        this.s0 = s0;        this.s1 = s1;        this.s2 = s2;        this.s3 = s3;        this.s4 = s4;        this.s5 = s5;        this.s7 = s7;    }    // 辅助构造函数，方便从 String[] 创建 Key 实例    public Key(String[] line) {        this(line[0], line[1], line[2], line[3], line[4], line[5], line[7]);    }    // Getter 方法 (如果需要，但对于内部键对象通常不是必需的)    public String getS0() { return s0; }    public String getS1() { return s1; }    public String getS2() { return s2; }    public String getS3() { return s3; }    public String getS4() { return s4; }    public String getS5() { return s5; }    public String getS7() { return s7; }    // 重新定义 equals 方法，只比较用于分组的字段 (s0, s1, s3, s5)    @Override    public boolean equals(Object o) {        if (this == o) return true;        if (o == null || getClass() != o.getClass()) return false;        Key key = (Key) o;        return Objects.equals(s0, key.s0) && Objects.equals(s1, key.s1) && Objects.equals(s3, key.s3) && Objects.equals(s5, key.s5);    }    // 重新定义 hashCode 方法，只包含用于分组的字段 (s0, s1, s3, s5)    @Override    public int hashCode() {        return Objects.hash(s0, s1, s3, s5);    }    // 将 Key 对象和聚合后的 s6 值转换回 String[]    public String[] toArray(Double s6) {        return new String[]{s0, s1, s2, s3, s4, s5, String.valueOf(s6), s7};    }}

equals() 和 hashCode() 的重要性：equals() 和 hashCode() 方法是 Map 和 Set 等集合类型正确工作的基石。

equals() 方法定义了两个对象何时被认为是“相等”的。在这里，我们只比较 s0, s1, s3, s5 这四个字段，因为它们是我们的分组依据。hashCode() 方法返回对象的哈希码。根据 Java 规范，如果两个对象 equals 返回 true，那么它们的 hashCode 必须相同。因此，hashCode() 也必须只基于 s0, s1, s3, s5 这四个字段来计算。

Key 对象中的其他字段（s2, s4, s7）虽然不参与分组，但它们在 Key 构造时被保留，以便在最终构建 String[] 结果时能够还原原始数据。

2. 使用 Stream API 进行分组和聚合

有了自定义的 Key 对象，我们现在可以利用 Java Stream API 来实现分组和求和：

import java.util.Arrays;import java.util.List;import java.util.Map;import java.util.stream.Collectors;public class DataAggregator {    public static void main(String[] args) {        List dataLines = List.of(            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "84M", "-101.87", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-102.48", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "60M", "-103.75", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-10.8", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "60M", "-110.39", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4055", "120M", "-10.8", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "CZK", "12670012.4055", "60M", "-103.75", "0"},            new String[]{"2002", "BRBTSS", "BRSTNCNTF212", "BRL", "12670012.4066", "20M", "-10.8", "0"}        );        List newDataLine = dataLines.stream()            .collect(Collectors.groupingBy(                Key::new, // 使用 Key::new 作为分类函数，将 String[] 转换为 Key 对象                Collectors.summingDouble(s -> Double.parseDouble(s[6])) // 对每个分组内的 String[] 的第6个元素求和            )) // 结果是一个 Map            .entrySet().stream() // 将 Map 转换为 Stream<Map.Entry>            .map(entry -> entry.getKey().toArray(entry.getValue())) // 对每个 Entry，使用 Key 的 toArray 方法重构 String[]            .collect(Collectors.toList()); // 收集为 List        // 打印结果        newDataLine.forEach(arr -> System.out.println(Arrays.toString(arr)));    }}

代码解析：

dataLines.stream(): 创建原始数据的 Stream。collect(Collectors.groupingBy(Key::new, …)): 这是核心的分组操作。Key::new: 作为分类函数（classifier），它将每个 String[] 元素转换为一个 Key 对象。groupingBy 会根据这些 Key 对象的 equals() 和 hashCode() 方法来决定哪些元素属于同一个组。Collectors.summingDouble(s -> Double.parseDouble(s[6])): 作为下游收集器（downstream collector），它对每个分组内的元素执行聚合操作。这里，它将每个 String[] 的第 6 个元素解析为 double 类型并进行求和。此步骤的结果是一个 Map，其中 Key 是分组依据，Double 是对应分组的第 6 个元素的总和。.entrySet().stream(): 将 Map 的 entrySet 转换为 Stream，以便我们可以遍历每个 Key-Value 对。.map(entry -> entry.getKey().toArray(entry.getValue())): 对 Stream 中的每个 Map.Entry 执行映射操作。entry.getKey() 获取分组的 Key 对象。entry.getValue() 获取该分组的聚合结果（求和后的 Double 值）。entry.getKey().toArray(entry.getValue()) 调用 Key 对象的 toArray 方法，将 Key 中保存的原始字段和聚合后的 Double 值组合，重新构建一个新的 String[]。.collect(Collectors.toList()): 将最终的 String[] 收集到一个 List 中。

示例输出

运行上述代码，将得到以下输出：

[2002, BRBTSS, BRSTNCNTF212, BRL, 12670012.4055, 84M, -101.87, 0][2002, BRBTSS, BRSTNCNTF212, BRL, 12670012.4055, 60M, -214.14, 0][2002, BRBTSS, BRSTNCNTF212, BRL, 12670012.4055, 120M, -124.08000000000001, 0][2002, BRBTSS, BRSTNCNTF212, BRL, 12670012.4066, 20M, -10.8, 0][2002, BRBTSS, BRSTNCNTF212, CZK, 12670012.4055, 60M, -103.75, 0]

可以看到，原始数据中 0th, 1st, 3rd, 5th 字段相同的行被成功分组，并且它们的 6th 字段被求和。例如，有三行数据的分组键为 (“2002”, “BRBTSS”, “BRL”, “120M”)，它们的 6th 字段分别是 -102.48, -10.8, -10.8，求和结果为 -124.08。

注意事项与最佳实践

数据结构优化：避免 List尽管本教程解决了 List 的分组问题，但在实际项目中，强烈建议将 String[] 替换为自定义的 Java 对象（POJO 或 record）。例如，可以定义一个 DataEntry 类，其中包含 year、id1、id2、currency、value1、timePeriod、amount、status 等有意义的字段。这样做的好处是：

类型安全： 字段具有明确的类型（int, String, double 等），避免了 String 到其他类型的频繁转换和潜在的 NumberFormatException。可读性： 通过字段名而非数组索引访问数据，代码更易理解和维护。健壮性： 避免因数组索引越界或数据格式不一致导致的问题。如果使用自定义对象，Key 对象可以直接引用这些对象的属性，而不是通过数组索引。

浮点数精度问题：使用 BigDecimal在处理金额、汇率等需要高精度的浮点数计算时，double 类型可能存在精度问题。尽管 Collectors.summingDouble() 在一定程度上缓解了这些问题，但最佳实践是使用 java.math.BigDecimal。如果使用 BigDecimal，你需要：

将 String[] 中表示金额的字符串解析为 BigDecimal。在 groupingBy 的下游收集器中使用 Collectors.reducing 或自定义收集器来执行 BigDecimal 的求和操作。BigDecimal 的求和示例：

// 假设您的数据项是自定义对象 DataEntry，其中包含 BigDecimal 类型的 amount 字段// Collectors.reducing(BigDecimal.ZERO, DataEntry::getAmount, BigDecimal::add)

这会稍微增加代码的复杂性，但能确保计算的精确性。

Java record 的优势Java 16 引入的 record 类型非常适合作为这种分组操作中的键对象。它自动生成了构造函数、访问器方法、equals() 和 hashCode() 方法，大大减少了样板代码。本教程中，我们通过重写 equals() 和 hashCode() 来定制分组逻辑，同时保留了 record 的简洁性。

总结

通过本教程，我们学习了如何利用自定义键对象结合 Java Stream API 来解决 List 类型数据的多字段分组和数值聚合问题。这种方法比嵌套 Collectors.groupingBy 更清晰、更易于管理，并且能够方便地将聚合结果转换回所需的 List

以上就是Java Stream 多字段分组与数值汇总教程的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/67934.html

ai java red 字符串解析

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

适合旅游行业使用的10款电子合同签署软件

上一篇 2025年11月12日 15:23:13

2025年热门的 12 款电子合同管理系统对比（含免费）

下一篇 2025年11月12日 15:23:30

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
6000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
3000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
2000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
1000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
2000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
1000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
1000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
1000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 好文分享
3000
好文分享

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
1000
好文分享

如何用 CSS Paint API 实现倾斜的斑马线间隔圆环？

实现斑马线边框样式：探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。问题：给定一个有多个圆圈组成的斑马线图案，如何使用 css 实现倾斜的斑马线间隔圆环？答案：立即学习“前端免费学习笔记（深入）”；使用 css paint api…

程序猿
2025年12月24日
1000
好文分享

如何使用CSS Paint API实现倾斜斑马线间隔圆环边框？

css实现斑马线边框样式想定制一个带有倾斜斑马线间隔圆环的边框？现在使用css paint api，定制任何样式都轻而易举。 css paint api 这是一个新的css特性，允许开发人员创建自定义形状和图案，其中包括斑马线样式。立即学习“前端免费学习笔记（深入）”；实现倾斜斑马线间隔圆环 …

程序猿
2025年12月24日
1000