
本教程深入探讨如何利用java stream api高效地将对象列表按指定属性分组,并从每个分组中选出具有最大值的元素,最终生成一个映射(map)。我们将重点介绍如何通过`collectors.tomap`结合`binaryoperator.maxby`,以简洁且声明式的方式实现这一常见的数据处理需求,避免繁琐的中间操作和手动集合初始化。
1. 场景描述与需求分析
在数据处理中,我们经常遇到需要从一个对象集合中,根据某个属性进行分组,并在每个分组内选出满足特定条件的元素。例如,给定一个学生成绩列表,我们希望找出每个学生的最高成绩记录。
假设我们有如下 StudentGrade 类,包含学生ID、成绩值和成绩日期:
import java.util.Date;public class StudentGrade { private int studentId; private double value; private Date date; public StudentGrade(int studentId, double value, Date date) { this.studentId = studentId; this.value = value; this.date = date; } public int getStudentId() { return studentId; } public double getValue() { return value; } public Date getDate() { return date; } @Override public String toString() { return "StudentGrade{" + "studentId=" + studentId + ", value=" + value + ", date=" + date + '}'; }}
我们的目标是获取一个 Map,其中键是 studentId,值是该学生对应的最高成绩记录。
2. 传统分组与最大值筛选方法及其局限性
一种常见的思路是首先使用 Collectors.groupingBy 按 studentId 分组,然后在每个分组中找出最大值。这通常会导致一个 Map<Integer, Optional>,因为 Collectors.maxBy 返回的是 Optional。随后,我们还需要遍历这个映射,解包 Optional 并将其放入一个新的 HashMap 中。
立即学习“Java免费学习笔记(深入)”;
以下是这种方法的示例:
import java.util.*;import java.util.stream.Collectors;public class GradeProcessor { public Map getMaxGradeByStudentTraditional(List grades) { // 第一步:按 studentId 分组,并找出每个分组中的最大成绩(Optional) Map<Integer, Optional> maxGradesOptional = grades.stream().collect( Collectors.groupingBy( StudentGrade::getStudentId, Collectors.maxBy(Comparator.comparing(StudentGrade::getValue))) ); // 第二步:遍历 Optional 映射,解包并放入新的 HashMap Map finalGrades = new HashMap(); maxGradesOptional.entrySet().forEach(entry -> { entry.getValue().ifPresent(value -> finalGrades.put(entry.getKey(), value)); }); return finalGrades; }}
这种方法虽然可行,但存在以下局限性:
美间AI
美间AI:让设计更简单
261 查看详情
需要两次映射操作:一次是 groupingBy,另一次是手动遍历 Optional 映射并填充新 HashMap。引入了 Optional 类型,需要额外的 ifPresent 处理,增加了代码的冗余。不够“流式化”,未能充分利用 Stream API 的声明式优势。
3. 优化方案:使用 Collectors.toMap 与 BinaryOperator.maxBy
Java Stream API 提供了一个更简洁、更优雅的解决方案,即利用 Collectors.toMap 的第三个参数——合并函数(mergeFunction)。当 Collectors.toMap 遇到键冲突时,mergeFunction 会被调用来决定保留哪个值。这正是我们用来选择最大值的好机会。
Collectors.toMap 的典型签名是:Collectors.toMap(keyMapper, valueMapper, mergeFunction)
keyMapper:用于从流元素中提取键的函数。valueMapper:用于从流元素中提取值的函数。mergeFunction:一个 BinaryOperator,当多个流元素映射到同一个键时,用于解决冲突。它接收两个值(旧值和新值),并返回应该保留的值。
结合 BinaryOperator.maxBy,我们可以直接在键冲突时比较并选择具有最大 value 的 StudentGrade 对象。
import java.util.*;import java.util.function.BinaryOperator;import java.util.function.Function;import java.util.stream.Collectors;public class GradeProcessor { public Map getMaxGradeByStudentOptimized(List grades) { return grades.stream() .collect(Collectors.toMap( StudentGrade::getStudentId, // keyMapper: 以 studentId 作为键 Function.identity(), // valueMapper: 以 StudentGrade 对象本身作为值 BinaryOperator.maxBy(Comparator.comparing(StudentGrade::getValue)) // mergeFunction: 当键冲突时,比较两个 StudentGrade 的 value,保留较大的 )); } public static void main(String[] args) { GradeProcessor processor = new GradeProcessor(); List studentGrades = Arrays.asList( new StudentGrade(1, 85.5, new Date(120, 0, 1)), // Jan 1, 2020 new StudentGrade(2, 90.0, new Date(120, 1, 15)), // Feb 15, 2020 new StudentGrade(1, 92.0, new Date(120, 2, 10)), // Mar 10, 2020 (Higher for student 1) new StudentGrade(3, 78.0, new Date(120, 3, 5)), // Apr 5, 2020 new StudentGrade(2, 88.0, new Date(120, 4, 20)), // May 20, 2020 (Lower for student 2) new StudentGrade(1, 89.0, new Date(120, 5, 1)), // Jun 1, 2020 (Lower for student 1) new StudentGrade(3, 95.0, new Date(120, 6, 1)), // Jul 1, 2020 (Higher for student 3) new StudentGrade(4, 80.0, new Date(120, 7, 1)) // Aug 1, 2020 ); System.out.println("原始成绩列表:"); studentGrades.forEach(System.out::println); System.out.println("\n-------------------------------------\n"); Map maxGrades = processor.getMaxGradeByStudentOptimized(studentGrades); System.out.println("每个学生的最高成绩记录:"); maxGrades.forEach((studentId, grade) -> System.out.println("学生ID: " + studentId + ", 最高成绩: " + grade) ); /* 预期输出: 学生ID: 1, 最高成绩: StudentGrade{studentId=1, value=92.0, date=Tue Mar 10 00:00:00 CST 2020} 学生ID: 2, 最高成绩: StudentGrade{studentId=2, value=90.0, date=Sat Feb 15 00:00:00 CST 2020} 学生ID: 3, 最高成绩: StudentGrade{studentId=3, value=95.0, date=Wed Jul 01 00:00:00 CST 2020} 学生ID: 4, 最高成绩: StudentGrade{studentId=4, value=80.0, date=Sat Aug 01 00:00:00 CST 2020} */ }}
代码解释:
grades.stream():创建 StudentGrade 对象的流。Collectors.toMap(…):将流中的元素收集到一个 Map 中。StudentGrade::getStudentId:这是 keyMapper。它告诉收集器,对于每个 StudentGrade 对象,使用其 studentId 作为 Map 的键。Function.identity():这是 valueMapper。它表示对于每个 StudentGrade 对象,使用对象本身作为 Map 的值。BinaryOperator.maxBy(Comparator.comparing(StudentGrade::getValue)):这是 mergeFunction。当两个或更多 StudentGrade 对象具有相同的 studentId(即键冲突)时,这个函数会被调用。Comparator.comparing(StudentGrade::getValue) 创建了一个比较器,用于比较两个 StudentGrade 对象的 value 属性。BinaryOperator.maxBy(…) 返回一个 BinaryOperator,它会使用提供的比较器来选择两个输入中“较大”的一个。在这里,“较大”意味着 value 更大的 StudentGrade 对象将被保留。
这种方法将整个逻辑封装在一个 collect 操作中,代码更加简洁、易读,且避免了中间 Optional 对象的处理和额外的 HashMap 初始化。
4. 总结与注意事项
简洁性与效率:使用 Collectors.toMap 结合 BinaryOperator 是处理此类“按键分组并聚合”问题的简洁且高效方式。它避免了多步操作和临时集合,使得代码更具声明性。Function.identity():当流中的元素本身就是我们希望作为 Map 值的对象时,Function.identity() 是一个非常方便的 valueMapper。BinaryOperator 的灵活性:BinaryOperator 不仅可以用于 maxBy,还可以用于 minBy,或者自定义任何合并逻辑(例如,求和、连接字符串等),使其在处理键冲突时非常灵活。适用于其他聚合:除了获取最大值,你也可以轻松地修改 mergeFunction 来实现获取最小值 (BinaryOperator.minBy),或者根据其他标准(如最新日期)来选择对象。错误处理:如果 keyMapper 可能返回 null,或者 valueMapper 返回 null 且 Map 实现不支持 null 值,需要额外考虑。然而,在大多数按ID分组的场景中,这些通常不是问题。
通过掌握 Collectors.toMap 的 mergeFunction 参数,开发者可以更有效地利用 Java Stream API 来解决复杂的数据转换和聚合问题,编写出更简洁、更富有表达力的代码。
以上就是Java Stream API:按属性分组并获取最大值映射的优雅实践的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/894415.html
微信扫一扫
支付宝扫一扫