Java Stream API：高效聚合数据并获取分组最大值映射

程序猿 • 2025年12月1日 18:52:07 • 用户投稿 • 阅读 1

本文详细介绍了如何利用java stream api高效地处理对象列表，实现按指定属性分组，并为每个分组找出具有最大值的对象，最终将结果收集到一个map中。教程着重于使用`collectors.tomap`结合`binaryoperator`作为合并函数的优化方案，旨在提供一种简洁、高性能且易于理解的数据聚合方法，避免传统多步操作的复杂性与冗余。

问题背景与传统挑战

在数据处理中，我们经常会遇到这样的场景：给定一个包含多个对象的列表，需要根据其中某个属性（例如，学生ID）进行分组，并在每个分组中找出另一个属性（例如，成绩值）最大的对象。最终，我们希望将这些最大值对象收集到一个映射（Map）中，其中键是分组依据的属性值，值是对应的最大值对象。

例如，假设我们有以下StudentGrade类：

public class StudentGrade {    int studentId;    double value; // 成绩值    Date date;    // 成绩记录日期    // 构造函数、Getter、Setter等省略    public StudentGrade(int studentId, double value, Date date) {        this.studentId = studentId;        this.value = value;        this.date = date;    }    public int getStudentId() {        return studentId;    }    public double getValue() {        return value;    }    public Date getDate() {        return date;    }    @Override    public String toString() {        return "StudentGrade{" +               "studentId=" + studentId +               ", value=" + value +               ", date=" + date +               '}';    }}

我们的目标是获取一个Map，其中键是studentId，值是该学生所有成绩中value最大的StudentGrade对象。

一种常见的初步尝试可能涉及以下步骤：先使用Collectors.groupingBy按studentId分组，然后对每个分组应用Collectors.maxBy找出最大值，最后遍历结果并处理Optional才能构建最终的Map。这种方法虽然可行，但通常会引入额外的中间Map、对Optional的解包操作，使得代码不够简洁和高效。

立即学习“Java免费学习笔记（深入）”；

// 传统但不够优化的方法示例public Map getMaxGradeByStudentInefficient(List grades) {    Map<Integer, Optional> maxGradesOptional = grades.stream().collect(        Collectors.groupingBy(            StudentGrade::getStudentId,            Collectors.maxBy(Comparator.comparing(StudentGrade::getValue)))    );    Map finalGrades = new HashMap();    maxGradesOptional.entrySet().forEach(entry -> {        entry.getValue().ifPresent(value -> finalGrades.put(entry.getKey(), value));    });    return finalGrades;}

这种方法需要创建一个新的HashMap并进行迭代，且处理了Optional，增加了代码的复杂性。

博思AIPPT

博思AIPPT来了，海量PPT模板任选，零基础也能快速用AI制作PPT。

博思AIPPT 117 查看详情

优化方案：使用 Collectors.toMap 与合并函数

Java Stream API提供了一个更简洁、更高效的解决方案，即利用Collectors.toMap的第三个参数——合并函数（merge function）。Collectors.toMap有多个重载方法，其中一个签名是toMap(keyMapper, valueMapper, mergeFunction)。

keyMapper：用于从流中的元素提取Map的键。valueMapper：用于从流中的元素提取Map的值。mergeFunction：这是一个BinaryOperator，当多个流元素映射到同一个键时，它定义了如何解决冲突（即如何合并这些值）。

利用mergeFunction，我们可以在遇到相同键时，直接比较对应的值，并保留我们想要的那一个（例如，最大的）。

核心实现

import java.util.Comparator;import java.util.Date;import java.util.List;import java.util.Map;import java.util.function.BinaryOperator;import java.util.function.Function;import java.util.stream.Collectors;public class StudentGradeProcessor {    // ... StudentGrade class definition (as above) ...    /**     * 使用Java Stream API高效地获取每个学生的最大成绩。     *     * @param grades 包含所有学生成绩的列表。     * @return 一个Map，键为studentId，值为该学生具有最大成绩值的StudentGrade对象。     */    public Map getMaxGradeByStudent(List grades) {        return grades.stream()                     .collect(Collectors.toMap(                         StudentGrade::getStudentId, // keyMapper: 使用studentId作为Map的键                         Function.identity(),        // valueMapper: 将StudentGrade对象本身作为Map的值                         BinaryOperator.maxBy(Comparator.comparing(StudentGrade::getValue)) // mergeFunction: 当key冲突时，保留value最大的StudentGrade对象                     ));    }    public static void main(String[] args) {        List grades = List.of(            new StudentGrade(1, 85.0, new Date(123, 0, 1)),            new StudentGrade(2, 92.5, new Date(123, 0, 2)),            new StudentGrade(1, 90.0, new Date(123, 0, 3)), // studentId 1 的新成绩，更高            new StudentGrade(3, 78.0, new Date(123, 0, 4)),            new StudentGrade(2, 88.0, new Date(123, 0, 5)), // studentId 2 的新成绩，更低            new StudentGrade(1, 88.0, new Date(123, 0, 6))  // studentId 1 的新成绩，居中        );        StudentGradeProcessor processor = new StudentGradeProcessor();        Map maxGrades = processor.getMaxGradeByStudent(grades);        maxGrades.forEach((studentId, grade) ->            System.out.println("Student ID: " + studentId + ", Max Grade: " + grade)        );        // 预期输出:        // Student ID: 1, Max Grade: StudentGrade{studentId=1, value=90.0, date=Wed Jan 03 00:00:00 CST 2024}        // Student ID: 2, Max Grade: StudentGrade{studentId=2, value=92.5, date=Tue Jan 02 00:00:00 CST 2024}        // Student ID: 3, Max Grade: StudentGrade{studentId=3, value=78.0, date=Thu Jan 04 00:00:00 CST 2024}    }}

方案解析

grades.stream(): 创建一个StudentGrade对象的流。Collectors.toMap(…): 这是核心收集器。StudentGrade::getStudentId: 作为keyMapper。对于流中的每个StudentGrade对象，它会提取studentId作为最终Map的键。Function.identity(): 作为valueMapper。它表示将原始的StudentGrade对象本身作为Map的值。你也可以写成x -> x，效果相同。BinaryOperator.maxBy(Comparator.comparing(StudentGrade::getValue)): 这是关键的mergeFunction。当Collectors.toMap处理流中的元素时，如果遇到两个或更多元素计算出相同的键（例如，两个不同的StudentGrade对象具有相同的studentId），mergeFunction就会被调用来解决这个冲突。BinaryOperator.maxBy(…)是一个预定义的BinaryOperator，它接受一个Comparator作为参数。Comparator.comparing(StudentGrade::getValue)创建了一个Comparator，它根据StudentGrade对象的value属性进行比较。因此，当发生键冲突时，BinaryOperator.maxBy会使用这个Comparator来比较两个冲突的StudentGrade对象，并保留value更大的那个。

优点与适用场景

简洁性: 代码高度精炼，在一行内完成了分组、求最大值和Map构建。效率: Stream API内部优化了处理流程，避免了显式循环和中间数据结构（如Optional包装和额外的HashMap）。可读性: 通过声明式编程，代码意图清晰，易于理解。通用性: 这种模式不仅适用于求最大值，通过修改BinaryOperator，可以轻松实现求最小值 (BinaryOperator.minBy)，或者其他自定义的合并逻辑。

注意事项与扩展

空列表处理: 如果输入的grades列表为空，getMaxGradeByStudent方法将返回一个空的Map，这通常是期望的行为。值相等时的处理: 如果多个StudentGrade对象具有相同的studentId和相同的最大value，BinaryOperator.maxBy会保留流中遇到的第一个这样的对象（或根据内部实现可能保留任意一个，但在多数实际应用中这通常不是问题，因为它们的值是相同的）。其他聚合: 这种模式可以扩展到其他聚合操作。例如，如果需要计算每个学生的总成绩，可以这样使用：

// 假设StudentGrade有一个方法可以获取分数public Map getTotalGradeByStudent(List grades) {    return grades.stream()                 .collect(Collectors.toMap(                     StudentGrade::getStudentId,                     StudentGrade::getValue,                     Double::sum // 合并函数：将两个分数相加                 ));}

或者使用Collectors.groupingBy和Collectors.reducing或Collectors.summingDouble进行更复杂的聚合。

总结

通过巧妙地运用Collectors.toMap的合并函数参数，Java Stream API为我们提供了一种优雅且高效的方式来处理“按属性分组并获取最大值（或其他聚合值）”的需求。这种方法不仅代码量少，可读性强，而且在性能上也优于传统的迭代和多步处理方案。掌握这一技巧，将大大提升Java数据处理的效率和代码质量。

以上就是Java Stream API：高效聚合数据并获取分组最大值映射的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/962136.html

ai app java red stream

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

TXT批量生成UPC-A条码

上一篇 2025年12月1日 18:52:07

等深四曲手感太清爽！小米15 Pro图赏

下一篇 2025年12月1日 18:52:09

用户投稿

js中join()方法的使用

join() 方法用于将数组元素连接成字符串，不修改原数组。默认以逗号分隔，可自定义分隔符，空数组返回空字符串，null 或 undefined 转为空字符串。在 JavaScript 中，join() 是数组的一个内置方法，用于将数组中的所有元素连接成一个字符串。这个方法不会修改原数组，而是返回…

程序猿
2026年5月10日
0000
用户投稿

Golang bytes字节操作与处理示例

Go语言bytes包提供高效字节切片操作，支持比较、查找、替换、大小写转换、修剪、拼接及分割合并等功能，适用于二进制数据处理与字符串转换。通过bytes.Equal、bytes.Index、bytes.ReplaceAll、bytes.TrimSpace、bytes.ToUpper/ToLower、…

程序猿
2026年5月10日
0000
用户投稿

如何利用“锤子线”的下影线长度来判断支撑的强度？

锤子线下影线越长，表明市场下方承接力越强，支撑潜力越大。一、锤子线出现在大幅下跌后的低位，空方推动价格下行后被多方反击拉回，形成较长下影线，其长度应至少为实体两倍以上才具参考价值；需结合位置、比例与成交量综合判断。二、通过下影线长度与近期平均真实波幅（ATR）的比值进行相对化评估：当前14根K线计算…

程序猿
2026年5月10日
0000
用户投稿

复杂约束下利用CSS选择器定位元素：非nth和非属性选择的策略

本文旨在探讨在严格CSS选择器限制下，如何精准定位HTML元素，特别是当`:nth-child`系列伪类、属性选择器`[data-target]`以及兄弟选择器`+`和`~`均被禁用时。文章将通过一个具体的案例，详细解析如何巧妙地结合`:first-child`、`:last-child`和`:no…

程序猿
2026年5月10日
0000
用户投稿

Svelte中实现变量的首次条件赋值与非响应式管理

在svelte应用中，对于滚动条高度这类一旦确定便通常保持不变的静态值，持续的响应式计算会造成不必要的性能开销。本教程将介绍一种优化策略，通过结合使用常规变量和条件响应式语句，实现变量的首次条件赋值。一旦满足特定条件并获取到有效值后，变量将停止后续的响应式更新，从而提高应用效率和可预测性。引言：S…

程序猿
2026年5月10日
0000
用户投稿

C++跨平台开发需要哪些工具 CMake跨平台构建指南

C++跨平台开发需依赖CMake等%ignore_a_1%链，核心在于抽象平台差异。CMake作为元构建系统，通过CMakeLists.txt生成各平台原生构建文件，协调编译器、IDE、调试器及包管理器（如vcpkg、Conan），实现跨平台编译。选择工具时需权衡项目规模、团队熟悉度、目标平台和依赖…

程序猿
2026年5月10日
0000
用户投稿

新手入门隐私币交易｜交易所选择与安全转账教学

Binance币安欧易OKX ️ Huobi火币️ 刚接触隐私币，最关心的无非两件事：钱放哪儿安全？怎么交易不被盯上？门罗币（XMR）这类主打匿名的加密货币，玩法和比特币不太一样。核心思路是“选对地方买，提出来存好”。别急着搞复杂操作，先把交易所选择和钱包转账这两步走稳，后面再研究混币、环签名那…

程序猿
2026年5月10日
0000
用户投稿

如何在多个文件输入框中实现独立图片预览功能

本教程详细阐述了如何在网页中实现多个文件输入框（`input type=”file”`）的独立图片预览功能。通过识别并解决常见错误，如重复id导致的元素选择不当，我们将演示如何利用dom遍历和事件委托，为每个上传区域动态绑定预览逻辑，确保用户上传的每张图片都能在其对应的位置正…

程序猿
2026年5月10日
0000
用户投稿

PHP异常怎么记录_PHP异常记录方法及错误日志管理。

答案：通过try-catch捕获异常并写入日志文件，设置全局异常处理器防止崩溃，配置php.ini启用内置错误日志功能，以及结合Monolog等第三方库实现多渠道结构化日志管理，可有效提升PHP应用的异常记录与错误排查能力。如果您的PHP应用程序在运行过程中出现异常，但没有明确的错误提示，可能是由…

程序猿
2026年5月10日
0000
用户投稿

自建服务器域名解析与配置详解：告别传统托管服务

本文将详细阐述如何为自建网站（如基于Raspberry Pi）配置域名，解释域名系统（DNS）的工作原理，并指导读者通过域名注册商将域名与服务器IP地址关联。文章将区分域名注册与网站托管服务的概念，帮助读者理解自建域名所需的关键步骤，避免常见误区。理解域名与DNS工作原理在互联网世界中，域名是网…

程序猿
2026年5月10日
0000
用户投稿

Go语言中如何高效查找字符串中多个字符的第一次出现？

Go语言高效查找字符串中多个字符首次出现位置 Go语言的strings.Index函数可以查找单个字符在字符串中的首次出现位置。但如果需要查找多个字符中的任意一个的首次出现位置，则需要更有效的方法。简单的循环和if语句虽然可行，但效率不高，尤其当需要查找的字符数量较多时。高效方法一种更高效的方…

程序猿
2026年5月10日
0000
用户投稿

如何理解Event Loop机制并对代码执行顺序进行精准控制？

Event Loop通过宏任务与微任务协调异步执行，同步代码先运行，随后清空微任务队列再执行宏任务，如：console.log(‘1’)、’4’同步输出，Promise.then入微任务队列输出’3’，setTimeout入宏任…

程序猿
2026年5月10日
0000
用户投稿

掌握 JavaScript 中的数组函数：slice、splice 和 forEach

JavaScript 数组函数详解：slice、splice 和 forEach JavaScript 提供丰富的内置数组方法，方便开发者操作和处理数组元素。本文重点介绍三种常用的数组方法：slice、splice 和 forEach，它们能显著提升数组操作的效率和代码简洁性。 1. slice()…

程序猿
2026年5月10日
0000
用户投稿

C++对象生命周期管理与RAII模式结合

RAII通过将资源管理绑定到对象生命周期，确保构造函数获取资源、析构函数释放资源，实现自动内存和资源管理。结合智能指针（如std::unique_ptr）、文件类、std::lock_guard等机制，RAII可有效避免内存泄漏、文件句柄未关闭、死锁等问题，尤其在异常发生时，C++栈展开保证已构造对…

程序猿
2026年5月10日
0000
用户投稿

Go语言对象工厂模式：利用接口实现多类型对象创建与管理

本文深入探讨了在go语言中设计灵活的对象工厂模式，旨在根据输入动态创建不同类型的对象。通过分析go的类型系统特性和常见设计误区，文章详细阐述了如何利用接口实现多态，从而构建一个健壮且可扩展的对象工厂函数，有效解决了返回类型不匹配的问题，并提供了完整的代码示例和最佳实践。在Go语言中，实现一个能够根…

程序猿
2026年5月10日
0000
用户投稿

使用CSS实现鼠标悬停时保持显示的下拉菜单

本文介绍了如何使用纯CSS实现下拉菜单在鼠标悬停时保持显示，以及鼠标移开后隐藏的交互效果。通过利用CSS的:hover伪类，可以避免使用JavaScript，简化代码并提高性能。同时，也讨论了这种方法在键盘可访问性方面的局限性，并提供了相应的注意事项。使用CSS :hover 伪类实现下拉菜单实…

程序猿
2026年5月10日
0000
实现图标逐个延迟显示的动画效果

本文将介绍如何使用 JavaScript 和 CSS 结合的方式，实现一个图标容器中图标逐个延迟显示的动画效果。通过 JavaScript 获取容器中的子元素，并利用 setTimeout 函数为每个图标添加一个 CSS 类，该 CSS 类定义了图标的过渡效果，从而实现图标的逐个延迟显示。 HTML…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

Python中高效模拟无重叠球体随机运动：利用cKDTree和Numba提升性能

本文探讨了在Python中高效模拟大量无重叠球体随机运动的方法。针对原始实现中因逐个球体碰撞检测导致的性能瓶颈，我们引入了多项优化策略。通过利用scipy.spatial.cKDTree的批量查询和多核并行能力，并结合Numba进行关键计算的热点加速，实现了显著的性能提升，有效解决了大规模球体运动模…

程序猿
2026年5月10日
0000
用户投稿

Linux用grep递归查找项目中未使用的CSS类名

先提取CSS文件中的类名，再从HTML和JS中找出使用的类名，最后对比得出未使用类。具体步骤：1. 用grep递归提取./css/下所有以.开头的类选择器，去除点并去重保存为css_classes.txt；2. 在./src/中搜索class属性内的类名，支持引号和模板字符串，提取单词形式的类名去重…

程序猿
2026年5月10日
0000
用户投稿

HTML文档侧边栏怎么创建_HTMLaside标签使用指南

答案：创建HTML侧边栏需用语义化标签结合CSS布局实现。首先用包裹相关但非核心的内容，如推荐链接、广告等，再通过Flexbox、Grid或Float等CSS技术将侧边栏定位在页面一侧；推荐使用Flexbox或Grid以提升响应式表现，并注意处理内容过多时的滚动与粘性定位，以及内容过少时的视觉平衡问…

程序猿
2026年5月10日
0000