使用Java Stream高效过滤嵌套列表数据并提取特定信息

使用Java Stream高效过滤嵌套列表数据并提取特定信息

本教程详细讲解如何利用java stream api高效处理嵌套数据结构。我们将以从产品图片列表中筛选出特定类型(如jpg)的图片url,并将其聚合为逗号分隔字符串为例,演示`filter`、`map`和`reduce`等核心操作的组合应用,旨在提升复杂数据处理的简洁性和可读性。

在现代软件开发中,我们经常需要处理复杂且嵌套的数据结构。例如,一个产品对象可能包含一个图片列表,而每张图片又可能包含多种格式类型。当我们需要从这样的结构中,根据某个深层嵌套的条件(例如,筛选出所有类型为JPG的图片URL)来提取并聚合信息时,传统的循环遍历方式往往会导致代码冗长、可读性差。Java 8引入的Stream API为这类问题提供了优雅且高效的解决方案。

场景描述与数据模型构建

假设我们有如下的产品数据结构,其中包含多个图片,每张图片有其URL和多种格式类型:

 product A :{    name: a    images: [      {           img1: 1           url: url1           type: [             {               format: jpg             }             {               format: png             }          ]      },      {           img2: 1           url: url2           type: [             {               format: mp4             }             {               format: png             }          ]      },      {           img3: 3           url: url3           type: [             {               format: jpg             }             {               format: mp4             }          ]      }    ]}

我们的目标是:从product A的所有images中,找出所有包含jpg格式的图片,并将其url以逗号分隔的形式返回。

为了在Java中表示上述数据,我们可以定义以下POJO(Plain Old Java Object)类:

立即学习“Java免费学习笔记(深入)”;

import java.net.URL;import java.util.List;import java.util.Objects;import java.util.stream.Collectors;import java.util.function.BinaryOperator;import java.util.function.Predicate;import java.util.Arrays;import java.util.Collection;// 产品类(在此示例中简化,只关注图片列表)class Product {    private String name;    private List images;    public Product(String name, List images) {        this.name = name;        this.images = images;    }    public String getName() {        return name;    }    public List getImages() {        return images;    }}// 图片类class Image {    private String id; // img1, img2, etc.    private URL url;    private List types;    public Image(String id, String url, List types) {        this.id = id;        try {            this.url = new URL(url);        } catch (Exception e) {            throw new RuntimeException(e);        }        this.types = types;    }    public String getId() {        return id;    }    public URL getUrl() {        return url;    }    public List getTypes() {        return types;    }}// 图片类型类class ImageType {    public enum Format {        JPG, PNG, MP4, GIF; // 定义支持的格式    }    private Format format;    public ImageType(Format format) {        this.format = format;    }    public Format getFormat() {        return format;    }    @Override    public boolean equals(Object o) {        if (this == o) return true;        if (o == null || getClass() != o.getClass()) return false;        ImageType imageType = (ImageType) o;        return format == imageType.format;    }    @Override    public int hashCode() {        return Objects.hash(format);    }}

使用Java Stream API进行过滤与聚合

Java Stream API提供了一系列链式操作,能够以声明式的方式处理集合数据。解决上述问题的核心步骤包括:过滤、映射和归约。

过滤(Filter): 筛选出符合特定条件的元素。在本例中,我们需要筛选出包含JPG格式的Image对象。映射(Map): 将过滤后的元素转换为我们需要的形式。这里是将Image对象映射为其URL字符串。归约(Reduce): 将所有映射后的结果聚合成一个单一的值。这里是将所有URL字符串用逗号连接起来。

下面是实现这一逻辑的Java Stream代码:

public class ImageProcessor {    // 定义一个BinaryOperator,用于将字符串用逗号连接    static final BinaryOperator reducer = (a, b) -> a + "," + b;    // 定义一个Predicate,用于判断图片是否包含JPG格式    static final Predicate isJpg = (image) -> image.getTypes().stream()                                                            .anyMatch(type -> type.getFormat() == ImageType.Format.JPG);    /**     * 从图片集合中获取所有包含JPG格式的图片URL,并以逗号分隔。     *     * @param images 图片集合     * @return 逗号分隔的JPG图片URL字符串,如果没有匹配项则返回"No Match!"     */    public static String getJpgUrls(final Collection images) {        return images.stream()                     .filter(isJpg) // 步骤1: 过滤出包含JPG格式的图片                     .map(Image::getUrl) // 步骤2: 将Image对象映射为URL对象                     .map(URL::toString) // 步骤2: 将URL对象映射为URL字符串                     .reduce(reducer) // 步骤3: 将所有URL字符串用逗号连接                     .orElse("No Match!"); // 如果没有匹配项,则返回默认值    }    public static void main(String[] args) {        // 构造示例数据        List productAImages = Arrays.asList(            new Image("img1", "http://example.com/url1.jpg", Arrays.asList(new ImageType(ImageType.Format.JPG), new ImageType(ImageType.Format.PNG))),            new Image("img2", "http://example.com/url2.mp4", Arrays.asList(new ImageType(ImageType.Format.MP4), new ImageType(ImageType.Format.PNG))),            new Image("img3", "http://example.com/url3.jpg", Arrays.asList(new ImageType(ImageType.Format.JPG), new ImageType(ImageType.Format.MP4))),            new Image("img4", "http://example.com/url4.gif", Arrays.asList(new ImageType(ImageType.Format.GIF)))        );        Product productA = new Product("Product A", productAImages);        // 调用方法获取JPG图片URL        String jpgUrls = getJpgUrls(productA.getImages());        System.out.println("JPG URLs for Product A: " + jpgUrls); // 预期输出: http://example.com/url1.jpg,http://example.com/url3.jpg        // 测试没有匹配项的情况        List noJpgImages = Arrays.asList(            new Image("img5", "http://example.com/url5.png", Arrays.asList(new ImageType(ImageType.Format.PNG))),            new Image("img6", "http://example.com/url6.mp4", Arrays.asList(new ImageType(ImageType.Format.MP4)))        );        String noMatchUrls = getJpgUrls(noJpgImages);        System.out.println("JPG URLs for No JPG Images: " + noMatchUrls); // 预期输出: No Match!    }}

代码解析

reducer (BinaryOperator):这是一个函数式接口实例,定义了如何将两个字符串合并为一个字符串。在这里,它简单地将两个字符串用逗号连接起来。reduce操作需要一个这样的二元操作符来逐步聚合流中的元素。

isJpg (Predicate):这是一个函数式接口实例,定义了一个条件判断。它接收一个Image对象,然后:

image.getTypes().stream(): 获取当前Image对象的所有ImageType,并将其转换为一个流。.anyMatch(type -> type.getFormat() == ImageType.Format.JPG): 检查这个ImageType流中是否存在任何一个ImageType的format是JPG。如果存在,则返回true,表示该图片包含JPG格式。

getJpgUrls(final Collection images) 方法:

images.stream(): 将输入的Image集合转换为一个流,这是所有Stream操作的起点。.filter(isJpg): 应用isJpg这个Predicate来过滤流中的Image对象。只有那些isJpg返回true的Image对象才能进入下一步。.map(Image::getUrl): 这是一个方法引用,等同于image -> image.getUrl()。它将过滤后的每个Image对象转换为其对应的URL对象。.map(URL::toString): 再次使用map操作,将上一步得到的URL对象转换为其字符串表示。.reduce(reducer): 这是归约操作。它使用reducer(即逗号连接的逻辑)将流中的所有URL字符串合并成一个单一的字符串。reduce操作返回一个Optional,因为流可能为空。.orElse(“No Match!”): 处理Optional的结果。如果reduce操作返回的Optional中包含一个值(即找到了匹配的URL),则返回该值;否则(即流为空,没有找到任何JPG图片),则返回字符串”No Match!”。

注意事项与最佳实践

可读性: 使用Predicate和BinaryOperator等函数式接口的实例,可以提高代码的可读性和模块化。将复杂的逻辑封装在独立的函数式接口中,使主业务逻辑流更加清晰。效率: Stream API在内部进行了优化,可以并行处理(通过parallelStream()),但在小规模数据上,并行流的开销可能大于收益。对于本例的场景,顺序流通常足够高效。空值处理: reduce操作返回Optional,这是一种优雅处理可能为空结果的方式,避免了传统的null检查,增强了代码的健壮性。数据模型设计: 清晰、合理的数据模型是使用Stream API的前提。确保POJO类有适当的getter方法,以便Stream能够访问其属性。不可变性: 在可能的情况下,尽量使用不可变对象,这有助于简化并发编程和提高代码的安全性。本例中的Image和ImageType对象在创建后其内部状态是不可变的。

总结

通过Java Stream API,我们能够以声明式、链式和高度可读的方式处理复杂的嵌套数据过滤和聚合任务。filter、map和reduce是Stream API中最核心的三个操作,它们的组合应用能够解决绝大多数数据处理场景。掌握这些技术,将显著提升您处理集合数据的效率和代码质量。

以上就是使用Java Stream高效过滤嵌套列表数据并提取特定信息的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/5058.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月5日 11:54:52
下一篇 2025年11月5日 11:55:31

相关推荐

  • MyBatis 中 XML 映射文件无法调用的问题排查与解决

    本文旨在帮助开发者解决在使用 Spring Boot 和 MyBatis 框架时,XML 映射文件中定义的 SQL 语句无法被正确调用的问题。文章将通过分析常见原因、提供解决方案以及代码示例,帮助读者快速定位并解决类似问题,确保 MyBatis 能够正确加载和执行 XML 映射文件中的 SQL 语句…

    2025年12月5日
    500
  • 如何解决PHP中货币数值处理和格式化难题,使用Spryker/Money让财务计算更精确

    最近在开发一个电商平台时,我遇到了一个让人头疼的问题:如何精确地处理和展示商品价格、订单总额等货币数值。PHP中的浮点数计算众所周知地不可靠(比如 0.1 + 0.2 并不严格等于 0.3 ),这在财务计算中是绝对不能接受的。更麻烦的是,我们的平台面向全球用户,这意味着我需要根据不同的国家和地区,以…

    开发工具 2025年12月5日
    000
  • HiDream-I1— 智象未来开源的文生图模型

    hidream-i1:一款强大的开源图像生成模型 HiDream-I1是由HiDream.ai团队开发的17亿参数开源图像生成模型,采用MIT许可证,在图像质量和对提示词的理解方面表现卓越。它支持多种风格,包括写实、卡通和艺术风格,广泛应用于艺术创作、商业设计、科研教育以及娱乐媒体等领域。 HiDr…

    2025年12月5日
    000
  • 如何在Laravel中集成支付网关

    在laravel中集成支付网关的核心步骤包括:1.根据业务需求选择合适的支付网关,如stripe、paypal或支付宝等;2.通过composer安装对应的sdk或laravel包,如stripe/stripe-php或yansongda/pay;3.在.env文件和config/services.…

    2025年12月5日
    300
  • Java中死锁如何避免 分析死锁产生的四个必要条件

    预防死锁最有效的方法是破坏死锁产生的四个必要条件中的一个或多个。死锁的四个必要条件分别是互斥、占有且等待、不可剥夺和循环等待;其中,互斥通常无法破坏,但可以减少使用;占有且等待可通过一次性申请所有资源来打破;不可剥夺可通过允许资源被剥夺打破;循环等待可通过按序申请资源解决。此外,reentrantl…

    2025年12月5日 java
    300
  • js如何实现剪贴板历史 js剪贴板历史管理的4种技术方案

    要实现js剪贴板历史,核心在于拦截复制事件、存储复制内容并展示历史记录。1. 使用document.addeventlistener(‘copy’)监听复制事件,并通过e.clipboarddata.getdata获取内容;2. 用localstorage或indexeddb…

    2025年12月5日 web前端
    100
  • 如何利用JavaScript实现前端日志记录与用户行为分析?

    前端日志与用户行为分析可通过封装Logger模块实现,支持分级记录并上报;结合事件监听自动采集点击、路由变化等行为数据。 前端日志记录与用户行为分析能帮助开发者了解用户操作路径、发现潜在问题并优化产品体验。通过JavaScript,我们可以轻量高效地实现这些功能,无需依赖复杂工具也能获取关键数据。 …

    2025年12月5日
    000
  • 如何在Laravel中实现缓存机制

    laravel的缓存机制用于提升应用性能,通过存储耗时操作结果避免重复计算。1. 配置缓存驱动:在.env文件中设置cache_driver,如redis,并安装相应扩展;2. 使用cache facade进行缓存操作,包括put、get、has、forget等方法;3. 使用remember和pu…

    2025年12月5日
    000
  • 如何解决前端JS文件过大导致加载缓慢的问题,使用linkorb/jsmin-php助你轻松实现JS代码压缩优化

    可以通过一下地址学习composer:学习地址 在快节奏的互联网世界里,网站的加载速度是用户体验的生命线。用户往往没有耐心等待一个缓慢的页面,而搜索引擎也更青睐加载迅速的网站。作为一名开发者,我深知这一点,但最近在优化我的php项目时,却遇到了一个让人头疼的问题:前端的javascript文件随着功…

    开发工具 2025年12月5日
    000
  • Java中Executors类的用途 掌握线程池工厂的创建方法

    如何使用executors创建线程池?1.使用newfixedthreadpool(int nthreads)创建固定大小的线程池;2.使用newcachedthreadpool()创建可缓存线程池;3.使用newsinglethreadexecutor()创建单线程线程池;4.使用newsched…

    2025年12月5日 java
    000
  • js如何解析XML格式数据 处理XML数据的4种常用方法!

    在javascript中解析xml数据主要有四种方式:原生domparser、xmlhttprequest、第三方库(如jquery)以及fetch api配合domparser。使用domparser时,创建实例并调用parsefromstring方法解析xml字符串,返回document对象以便…

    2025年12月5日 web前端
    100
  • 解决WordPress博客首页无法显示页面标题的问题

    摘要:本文针对WordPress主题开发中,使用静态页面作为博客首页时,home.php无法正确显示页面标题的问题,提供了详细的解决方案。通过使用get_the_title()函数并结合get_option(‘page_for_posts’)获取文章页面的ID,从而正确显示博…

    2025年12月5日
    000
  • 如何在Laravel中处理表单提交

    在laravel中处理表单提交的步骤如下:1. 创建包含正确method、action属性和@csrf指令的html表单;2. 在routes/web.php或routes/api.php中定义路由,如route::post(‘/your-route’, ‘you…

    2025年12月5日
    100
  • WordPress博客首页无法显示页面标题的解决方案

    本教程旨在解决WordPress主题开发中,使用静态首页和博客页面展示最新文章时,home.php无法正确获取页面标题和特色图像的问题。通过使用get_the_title()函数并结合get_option(‘page_for_posts’)获取博客页面的ID,可以确保博客首页…

    2025年12月5日
    000
  • Java中jstat的用法 详解性能统计

    要使用jstat监控jvm,首先通过jps获取进程id,然后执行jstat命令并指定监控类型、采样间隔和次数。1)常用选项包括-gcutil查看垃圾回收利用率统计;2)-gc查看更详细的垃圾回收信息;3)-class监控类加载与卸载情况。例如:jstat -gcutil 1234 1000可每秒输出…

    2025年12月5日 java
    100
  • 126邮箱官网登录入口网页版 126邮箱登录首页官网

    126邮箱官网登录入口网页版为https://mail.126.com,用户可通过邮箱账号或手机号快速注册登录,支持密码找回、扫码验证;页面适配多设备,具备分栏式收件箱、邮件筛选、批量操作及星标分类功能;附件上传下载支持实时进度与断点续传,兼容多种文件格式预览。 126邮箱官网登录入口网页版在哪里?…

    2025年12月5日
    100
  • 曝小米已终止澎湃OS 2全部开发工作!聚焦澎湃OS 3

    CNMO从海外媒体获悉,小米已全面停止对澎湃OS 2的所有开发进程,集中力量推进下一代操作系统——澎湃OS 3的开发与发布准备。 据最新消息,澎湃OS 3有望于今年8月或9月正式亮相。初步资料显示,新系统将重点提升用户界面的精致度、系统动画的流畅性以及整体运行性能。小米方面强调,将确保现有设备用户能…

    2025年12月5日
    000
  • Swoole与gRPC的集成实践

    将swoole与grpc集成可以通过以下步骤实现:1. 在swoole的异步环境中运行grpc服务,使用swoole的协程服务器处理grpc请求;2. 处理grpc的请求与响应,确保在swoole的协程环境中进行;3. 优化性能,利用swoole的连接池、缓存和负载均衡功能。这需要对swoole的协…

    2025年12月5日
    000
  • js怎样实现粒子动画效果 炫酷粒子动画的3种实现方式

    实现炫酷的粒子动画可通过以下三种方式:1. 使用 canvas 实现基础 2d 粒子动画,通过创建 canvas 元素、定义粒子类、使用 requestanimationframe 创建动画循环来不断更新和绘制粒子;2. 使用 three.js 实现 3d 粒子动画,借助 webgl 渲染器、场景、…

    2025年12月5日 web前端
    000
  • AI 赋能云电脑智变升级 中兴通讯助力中国移动共绘端云算网新生态

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2025中国移动云智算大会在苏州举行,中兴通讯与中国移动携手展示基于AI技术的云电脑创新成果,彰显双方在智能算力领域的深度合作。 大会集中展示了涵盖训练及推理集群、智算网络和智慧终端的全场景智算…

    2025年12月5日
    000

发表回复

登录后才能评论
关注微信