
本文介绍了如何使用 Java Stream API 将从两个 CSV 文件中读取的城市和国家数据进行关联。通过遍历城市列表,并使用 Stream API 在国家列表中查找匹配的国家代码,最终将国家名称添加到对应的城市对象中,保持原始城市列表的顺序。
在实际应用中,我们经常需要从多个数据源(例如 CSV 文件)读取数据,并将它们按照某种规则进行关联。本文以城市和国家数据为例,演示如何使用 Java Stream API 实现高效的数据合并,并保持原始数据的顺序。
数据模型
首先,定义两个 Java 类 City 和 Country 来表示城市和国家的数据结构。这两个类都使用了 @CsvBindByPosition 注解,该注解来自 opencsv 库,用于将 CSV 文件中的列绑定到类的属性。
立即学习“Java免费学习笔记(深入)”;
import com.opencsv.bean.CsvBindByPosition;public class City { @CsvBindByPosition(position = 0) private Integer id; @CsvBindByPosition(position = 1) private String name; @CsvBindByPosition(position = 2) private String countryCode; private String countryName; // 新增字段,用于存储国家名称 // Getters and setters public Integer getId() { return id; } public void setId(Integer id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public String getCountryCode() { return countryCode; } public void setCountryCode(String countryCode) { this.countryCode = countryCode; } public String getCountryName() { return countryName; } public void setCountryName(String countryName) { this.countryName = countryName; } @Override public String toString() { return "City{" + "id=" + id + ", name='" + name + ''' + ", countryCode='" + countryCode + ''' + ", countryName='" + countryName + ''' + '}'; }}
import com.opencsv.bean.CsvBindByPosition;public class Country { @CsvBindByPosition(position = 0) private Integer id; @CsvBindByPosition(position = 1) private String name; @CsvBindByPosition(position = 2) private String code; // Getters and setters public Integer getId() { return id; } public void setId(Integer id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public String getCode() { return code; } public void setCode(String code) { this.code = code; } @Override public String toString() { return "Country{" + "id=" + id + ", name='" + name + ''' + ", code='" + code + ''' + '}'; }}
数据读取与关联
接下来,假设我们已经从 CSV 文件中读取了城市和国家的数据,并将它们分别存储在 List 和 List 类型的变量 cities 和 countries 中。
以下代码展示了如何使用 Java Stream API 将城市和国家数据进行关联,并将国家名称设置到对应的城市对象中:
import java.util.Arrays;import java.util.List;public class StreamMerge { public static void main(String[] args) { // 模拟从CSV读取的数据 List countries = Arrays.asList( new Country(100, "Germany", "DE"), new Country(105, "France", "FR"), new Country(108, "Denmark", "DK") ); List cities = Arrays.asList( new City(1, "Berlin", "DE"), new City(2, "Munich", "DE"), new City(3, "Köln", "DE"), new City(4, "Paris", "FR"), new City(5, "Kopenhag", "DK") ); // 使用 Stream API 关联数据 cities.forEach(city -> city.setCountryName(countries.stream() .filter(country -> country.getCode().equals(city.getCountryCode())) .map(Country::getName) .findAny() .orElse(null))); // 打印结果 cities.forEach(System.out::println); }}
代码解释
cities.forEach(city -> …): 遍历城市列表,对每个城市对象执行后续操作。countries.stream(): 创建一个国家列表的 Stream 对象。.filter(country -> country.getCode().equals(city.getCountryCode())): 使用 filter 方法过滤国家列表,只保留国家代码与当前城市代码匹配的国家。.map(Country::getName): 使用 map 方法将匹配的国家对象转换为国家名称字符串。.findAny(): 从 Stream 中获取任意一个元素(由于国家代码应该是唯一的,所以这里取任意一个都可以)。.orElse(null): 如果 Stream 为空(即没有找到匹配的国家),则返回 null。city.setCountryName(…): 将获取到的国家名称设置到当前城市对象的 countryName 属性中。
注意事项
数据唯一性: 上述代码假设国家代码在国家列表中是唯一的。如果存在重复的国家代码,findAny() 方法可能会返回不同的结果。如果需要处理重复的国家代码,可以使用 findFirst() 方法来确保返回第一个匹配的结果。性能考虑: 对于大型数据集,可以考虑使用 HashMap 来存储国家数据,以提高查找效率。例如,可以创建一个以国家代码为键,国家名称为值的 HashMap,然后在遍历城市列表时,直接从 HashMap 中查找对应的国家名称。异常处理: 在实际应用中,需要考虑 CSV 文件读取失败、数据格式错误等异常情况,并进行适当的异常处理。
总结
本文展示了如何使用 Java Stream API 将从多个 CSV 文件中读取的数据进行关联。通过使用 Stream API 的 filter、map 和 findAny 方法,可以高效地实现数据合并,并保持原始数据的顺序。在实际应用中,需要根据具体情况选择合适的数据结构和算法,并进行适当的异常处理,以确保程序的正确性和性能。
以上就是Java Stream 实现 CSV 数据合并:城市与国家信息关联的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/202255.html
微信扫一扫
支付宝扫一扫