
本文详细介绍了如何利用Java Stream API高效地从嵌套列表中提取并收集唯一的元素。通过对比flatMap()和mapMulti()两种核心操作,文章演示了如何将多层数据结构扁平化,并最终将目标属性(如城市名称)收集到一个Set中,从而避免了传统嵌套循环的复杂性,提升代码的简洁性和可读性。
在现代java开发中,处理集合数据是常见的任务。我们经常会遇到这样的场景:一个对象列表中,每个对象又包含一个子列表,我们需要从这些子列表中提取特定的属性,并收集其唯一值。例如,我们有一个employee(员工)列表,每个employee对象包含一个address(地址)列表,而每个address对象又有一个city(城市)属性。我们的目标是获取所有员工居住过的城市的唯一名称集合。
示例数据模型
首先,我们定义Employee和Address这两个类,它们将作为我们数据结构的基础:
import java.util.List;import java.util.Set;import java.util.ArrayList;import java.util.HashSet;import java.util.stream.Collectors;public class StreamTutorial { public static class Address { private String city; public Address(String city) { this.city = city; } public String getCity() { return city; } @Override public String toString() { return "Address{" + "city='" + city + ''' + '}'; } } public static class Employee { private List addresses; public Employee(List addresses) { this.addresses = addresses; } public List getAddresses() { return addresses; } @Override public String toString() { return "Employee{" + "addresses=" + addresses + '}'; } } // 传统方法(用于对比) public static Set getCityUniqueNameLegacy(List employees) { Set cityUniqueName = new HashSet(); for (Employee e : employees) { List addList = e.getAddresses(); for (Address add : addList) { cityUniqueName.add(add.getCity()); } } return cityUniqueName; } // 主方法用于演示 public static void main(String[] args) { // 准备示例数据 List employees = new ArrayList(); employees.add(new Employee(List.of(new Address("New York"), new Address("London")))); employees.add(new Employee(List.of(new Address("Paris"), new Address("New York")))); employees.add(new Employee(List.of(new Address("London"), new Address("Tokyo")))); System.out.println("--- 传统方法获取唯一城市 ---"); Set legacyCities = getCityUniqueNameLegacy(employees); System.out.println(legacyCities); // 输出: [New York, London, Paris, Tokyo] System.out.println("n--- 使用 flatMap() 获取唯一城市 ---"); Set flatMapCities = getCityUniqueNameWithFlatMap(employees); System.out.println(flatMapCities); // 输出: [New York, London, Paris, Tokyo] System.out.println("n--- 使用 mapMulti() 获取唯一城市 ---"); Set mapMultiCities = getCityUniqueNameWithMapMulti(employees); System.out.println(mapMultiCities); // 输出: [New York, London, Paris, Tokyo] }}
传统上,我们会使用嵌套的for循环来遍历Employee列表及其内部的Address列表,然后将每个城市的名称添加到HashSet中以确保唯一性。上述代码中的getCityUniqueNameLegacy方法展示了这种实现方式。虽然这种方法可行,但当逻辑变得更复杂时,嵌套循环会降低代码的可读性和简洁性。
使用 Stream API 扁平化和收集唯一值
Java 8 引入的 Stream API 提供了一种更声明式、更简洁的方式来处理集合数据。对于从嵌套集合中提取数据的场景,Stream API 中的扁平化操作(flatMap()和mapMulti())是关键。
1. 使用 Stream.flatMap()
flatMap()操作是Stream API中用于扁平化流的强大工具。它接收一个函数作为参数,该函数将流中的每个元素转换成一个新的流,然后flatMap()会将所有这些新生成的流合并(扁平化)为一个单一的流。
立即学习“Java免费学习笔记(深入)”;
在我们的例子中,Stream需要转换为Stream
,然后才能进一步提取城市名称。flatMap()正是为此而生。实现方式:
public static Set getCityUniqueNameWithFlatMap(List employees) { return employees.stream() // 将List转换为Stream .flatMap(employee -> employee.getAddresses().stream()) // 将每个Employee对象的地址列表(List)转换为一个Stream,然后扁平化所有这些Stream为一个单一的Stream .map(Address::getCity) // 从每个Address对象中提取城市名称(String) .collect(Collectors.toSet()); // 将所有唯一的城市名称收集到一个Set中}
解析:
employees.stream():首先,我们从List创建了一个Stream。flatMap(employee -> employee.getAddresses().stream()):这是核心步骤。对于流中的每个Employee对象,我们调用employee.getAddresses()获取其List
,然后通过.stream()将其转换为Stream。flatMap()接着将所有这些独立的Stream连接成一个连续的Stream。map(Address::getCity):现在我们有了一个Stream,我们可以使用map()操作将每个Address对象转换成它的city字符串。Address::getCity是方法引用,等同于address -> address.getCity()。collect(Collectors.toSet()):最后,我们使用collect()终端操作和Collectors.toSet()收集器,将流中的所有城市名称收集到一个Set中。Set的特性保证了所有收集到的城市名称都是唯一的。2. 使用 Stream.mapMulti()
mapMulti()是Java 16中引入的一个操作,它提供了一种更灵活的方式来转换流元素,尤其适用于一个输入元素可能产生零个、一个或多个输出元素的场景。它接收一个BiConsumer作为参数,其中第一个参数是当前流元素,第二个参数是一个Consumer,用于将结果元素添加到下游流中。
实现方式:
public static Set getCityUniqueNameWithMapMulti(List employees) { return employees.stream() // 将List转换为Stream .mapMulti((employee, addressConsumer) -> // 为每个Employee应用转换 employee.getAddresses().forEach(addressConsumer)) // 遍历当前Employee的地址列表,并将每个地址通过addressConsumer添加到下游流 .map(Address::getCity) // 从每个Address对象中提取城市名称 .collect(Collectors.toSet()); // 收集唯一的城市名称到Set中}
解析:
employees.stream():与flatMap()方法一样,首先创建Stream。.
mapMulti((employee, addressConsumer) -> employee.getAddresses().forEach(addressConsumer)):这是mapMulti()的核心。是类型提示,指定了mapMulti操作将产生Address类型的元素。BiConsumer的第一个参数employee是当前流中的Employee对象。第二个参数addressConsumer是一个Consumer,它的作用是将Address对象“推送”到下游流中。employee.getAddresses().forEach(addressConsumer):对于每个Employee,我们获取其地址列表,并使用forEach方法遍历这个列表,将每个Address对象传递给addressConsumer。这样,所有的Address对象就被有效地扁平化并送入了下游流。map(Address::getCity):后续步骤与flatMap()方法相同,从Stream中提取城市名称。collect(Collectors.toSet()):将唯一的城市名称收集到Set中。总结与注意事项
简洁性与可读性:无论是flatMap()还是mapMulti(),都比传统的嵌套for循环提供了更简洁、更具声明性的代码。它们使得数据转换的意图更加清晰。
选择合适的扁平化操作:
flatMap()更直观地表达了“将流中的流扁平化”的概念,适用于每个输入元素明确地映射到一个新的流,且这些流需要合并的场景。mapMulti()提供了更细粒度的控制。当一个输入元素可能产生零个、一个或多个输出元素,且转换逻辑可能比较复杂时,mapMulti()会非常有用。在某些性能敏感的场景下,mapMulti()可能因为避免了创建中间流对象的开销而略有优势,但对于本例这种简单的扁平化操作,两者在性能上的差异通常可以忽略不计。
空值处理:在实际应用中,employee.getAddresses()可能返回null。为了避免NullPointerException,可以考虑在flatMap或mapMulti的Lambda表达式中添加null检查,或者确保getAddresses()方法总是返回一个非null的空列表。例如:
// flatMap中处理null.flatMap(employee -> Optional.ofNullable(employee.getAddresses()).orElse(Collections.emptyList()).stream())// mapMulti中处理null.mapMulti((employee, consumer) -> { List addresses = employee.getAddresses(); if (addresses != null) { addresses.forEach(consumer); }})
并行处理:Stream API天生支持并行处理。如果数据量非常大,可以通过employees.parallelStream()轻松地将操作并行化,以提高处理速度。
通过掌握flatMap()和mapMulti(),您可以更高效、更优雅地处理Java中复杂的嵌套集合数据,编写出更具现代感的代码。
以上就是Java Stream API:高效处理嵌套列表并获取唯一元素的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/28045.html
微信扫一扫
支付宝扫一扫