Java 文件解析与数据处理:解决 ArrayList 空值及排序问题

Java 文件解析与数据处理:解决 ArrayList 空值及排序问题

在 Java 应用开发中,从外部文件读取结构化数据并进行处理是常见的任务。然而,这一过程常常伴随着各种潜在的问题,尤其是在数据格式不严格时。本文将聚焦于一个典型的场景:从 CSV 格式文件读取电影信息,将其分类存储到 `ArrayList` 中,并按年份排序。我们将分析导致 `ArrayList` 为空和数据解析异常的常见原因,并提供专业的解决方案。

1. 问题分析:数据解析的陷阱

在处理文件输入时,开发者经常会遇到两种主要问题:

NumberFormatException: 当尝试将包含非数字字符的字符串转换为数字类型(如 int 或 double)时,会抛出此异常。这通常是由于输入字符串中包含意外的空格、换行符或其他不可见字符。数据分类失败: 即使数据被成功读取,如果分类逻辑(例如,基于字符串比较)不够健壮,也可能导致数据无法正确匹配到预期的类别,从而使相应的 ArrayList 保持为空。

在给定的电影信息处理案例中,原始代码在尝试解析电影年份和流派时遇到了上述问题。例如,当文件中的一行数据为 Schindler’s List, 1994, War, R 时:

movieInfo[1] 得到的是 ” 1994″,而非 “1994”。直接使用 Integer.parseInt(” 1994″) 会导致 NumberFormatException。movieInfo[2] 得到的是 ” War”,而非 “War”。因此,genre.equals(“War”) 的判断始终为 false,导致所有电影都无法被正确分类到任何流派的 ArrayList 中。

这些问题的根源在于文件数据中的额外空格,而默认的 String.split(“,”) 方法无法自动处理这些空格。

2. 解决方案:数据清洗与健壮解析

为了解决上述问题,我们需要在数据读取和解析阶段进行必要的清洗。有两种主要方法可以实现这一点:

2.1 使用 String.trim() 方法

String.trim() 方法可以移除字符串两端的空白字符(包括空格、制表符、换行符等)。这是最直接且易于理解的方法。在解析每个字段后,立即调用 trim() 方法。

立即学习“Java免费学习笔记(深入)”;

// 原始代码:// String[] movieInfo = movie.split(",");// String title = movieInfo[0];// int year = Integer.parseInt(movieInfo[1]);// String genre = movieInfo[2];// 改进后:String[] movieInfo = movie.split(",");String title = movieInfo[0].trim(); // 移除标题两端空格int year = Integer.parseInt(movieInfo[1].trim()); // 移除年份两端空格后再转换String genre = movieInfo[2].trim(); // 移除流派两端空格String rating = movieInfo[3].trim(); // 移除评分两端空格

通过在每个字段上调用 trim(),可以确保 Integer.parseInt() 接收到纯数字字符串,并且流派字符串与预定义的常量完全匹配。

2.2 使用正则表达式优化 String.split()

更优雅且推荐的方法是利用正则表达式来增强 split() 方法。我们可以让 split() 不仅在逗号处分割,还能自动忽略逗号后的任意数量的空白字符。

Delphi 7应用编程150例 全书内容 CHM版 Delphi 7应用编程150例 全书内容 CHM版

Delphi 7应用编程150例 CHM全书内容下载,全书主要通过150个实例,全面、深入地介绍了用Delphi 7开发应用程序的常用方法和技巧,主要讲解了用Delphi 7进行界面效果处理、图像处理、图形与多媒体开发、系统功能控制、文件处理、网络与数据库开发,以及组件应用等内容。这些实例简单实用、典型性强、功能突出,很多实例使用的技术稍加扩展可以解决同类问题。使用本书最好的方法是通过学习掌握实例中的技术或技巧,然后使用这些技术尝试实现更复杂的功能并应用到更多方面。本书主要针对具有一定Delphi基础知识

Delphi 7应用编程150例 全书内容 CHM版 0 查看详情 Delphi 7应用编程150例 全书内容 CHM版

// 改进后:// 使用正则表达式 ",s*"。// "," 表示匹配一个逗号。// "s*" 表示匹配零个或多个空白字符(空格、制表符、换行符等)。String[] movieInfo = movie.split(",s*");String title = movieInfo[0]; // 无需再trim,因为split已经处理了int year = Integer.parseInt(movieInfo[1]); // 无需再trimString genre = movieInfo[2]; // 无需再trimString rating = movieInfo[3]; // 无需再trim

这种方法简化了后续代码,因为每个 movieInfo 数组元素在被访问时已经去除了前导空白。

3. 数据排序:实现 Comparator

为了实现按年份对电影进行排序,我们需要定义一个 Comparator。Comparator 是一个函数式接口,用于定义两个对象之间的比较规则。

import java.util.Comparator;public class MovieComparator implements Comparator {    @Override    public int compare(Movie m1, Movie m2) {        // 按照年份升序排序        return Integer.compare(m1.getYearReleased(), m2.getYearReleased());    }}

有了 MovieComparator,就可以使用 ArrayList 的 sort() 方法对电影列表进行排序:

adventure.sort(new MovieComparator());drama.sort(new MovieComparator());// ... 对其他所有流派列表进行排序

4. 完整示例代码与改进

以下是整合了数据清洗和排序功能的完整 Java 代码示例。

4.1 MovieListing.txt 文件示例

假设 MovieListing.txt 文件内容如下(请注意逗号后的空格):

Steven SpielbergJohn WilliamsSchindler's List, 1994, War, RAmistad, 1997, Drama, RThe Post, 2017, Drama, PG-13E.T. the Extra-Terrestrial, 1982, Sci Fi, PGJurassic Park, 1993, Sci Fi, PG-13

4.2 Director.java

public class Director {    private String directorName;    private String composerName;    public Director(String d, String c) {        this.directorName = d;        this.composerName = c;    }    public String getDirectorName() {        return directorName;    }    public void setDirectorName(String directorName) {        this.directorName = directorName;    }    public String getComposerName() {        return composerName;    }    public void setComposerName(String composerName) {        this.composerName = composerName;    }}

4.3 Movie.java

public class Movie extends Director { // 注意:Movie继承Director在面向对象设计上可能不合理,但此处保留原结构    private String title;    private int yearReleased;    private String genre;    private String rating;    public Movie(String title, int yearReleased, String genre, String rating, String directorName, String composerName) {        super(directorName, composerName);        this.title = title;        this.yearReleased = yearReleased;        this.genre = genre;        this.rating = rating;    }    public String getTitle() {        return title;    }    public void setTitle(String title) {        this.title = title;    }    public int getYearReleased() {        return yearReleased;    }    public void setYearReleased(int yearReleased) {        this.yearReleased = yearReleased;    }    public String getGenre() {        return genre;    }    public void setGenre(String genre) {        this.genre = genre;    }    public String getRating() {        return rating;    }    public void setRating(String rating) {        this.rating = rating;    }    @Override    public String toString() { // 重写toString方便调试输出        return "Movie{" +               "title='" + title + ''' +               ", yearReleased=" + yearReleased +               ", genre='" + genre + ''' +               ", rating='" + rating + ''' +               ", director='" + getDirectorName() + ''' +               ", composer='" + getComposerName() + ''' +               '}';    }}

4.4 MovieComparator.java

import java.util.Comparator;public class MovieComparator implements Comparator {    @Override    public int compare(Movie m1, Movie m2) {        // 按照年份升序排序        return Integer.compare(m1.getYearReleased(), m2.getYearReleased());    }}

4.5 Driver.java (核心逻辑改进)

import java.util.ArrayList;import java.util.Scanner;import javax.swing.JOptionPane;import java.io.*;public class Driver {    public void start() throws FileNotFoundException {        // Initialize arraylists        ArrayList adventure = new ArrayList();        ArrayList drama = new ArrayList();        ArrayList fantasy = new ArrayList();        ArrayList romance = new ArrayList();        ArrayList sciFi = new ArrayList();        ArrayList thriller = new ArrayList();        ArrayList war = new ArrayList();        String directorName = "";        String composerName = "";        File myObj = new File("MovieListing.txt");        try (Scanner myReader = new Scanner(myObj)) { // 使用try-with-resources确保Scanner关闭            if (myReader.hasNextLine()) {                directorName = myReader.nextLine().trim(); // 读取并trim导演名            }            if (myReader.hasNextLine()) {                composerName = myReader.nextLine().trim(); // 读取并trim作曲家名            }            while (myReader.hasNextLine()) {                String movieLine = myReader.nextLine();                // 改进点:使用正则表达式 ",s*" 分割字符串,自动处理逗号后的空格                String[] movieInfo = movieLine.split(",s*");                if (movieInfo.length < 4) { // 简单的数据完整性检查                    System.err.println("Skipping malformed line: " + movieLine);                    continue;                }                String title = movieInfo[0];                int year = Integer.parseInt(movieInfo[1]);                String genre = movieInfo[2];                String rating = movieInfo[3];                Movie movie1 = new Movie(title, year, genre, rating, directorName, composerName);                // sort movies into arraylists                if (genre.equals("Adventure")) {                    adventure.add(movie1);                } else if (genre.equals("Drama")) {                    drama.add(movie1);                } else if (genre.equals("Fantasy")) {                    fantasy.add(movie1);                } else if (genre.equals("Romance")) {                    romance.add(movie1);                } else if (genre.equals("Sci Fi")) {                    sciFi.add(movie1);                } else if (genre.equals("Thriller")) {                    thriller.add(movie1);                } else if (genre.equals("War")) {                    war.add(movie1);                }            }        } catch (FileNotFoundException e) {            System.err.println("Error: MovieListing.txt not found. " + e.getMessage());            throw e; // 重新抛出异常,让调用者处理        } catch (NumberFormatException e) {            System.err.println("Error parsing number: " + e.getMessage());            // 可以选择跳过该行或进行其他错误处理        }        // 调试输出,检查列表是否已填充        System.out.println("Adventure Movies: " + adventure);        System.out.println("War Movies: " + war); // 示例        // Ask the user which genre they would like to view        String genreChoice = JOptionPane.showInputDialog("Director: " + directorName + "" +                "Composer: " + composerName + "" +                "Which genre would you like? " +                "1. Adventure " +                "2. Drama " +                "3. Fantasy " +                "4. Romance " +                "5. SciFi " +                "6. Thriller " +                "7. War " +                "Your choice: ");        // Sort all movie lists by year released        MovieComparator movieComparator = new MovieComparator();        adventure.sort(movieComparator);        drama.sort(movieComparator);        fantasy.sort(movieComparator);        romance.sort(movieComparator);        sciFi.sort(movieComparator);        thriller.sort(movieComparator);        war.sort(movieComparator);        // Display the output dialog box        StringBuilder output = new StringBuilder();        output.append("Director: ").append(directorName).append("");        output.append("Composer: ").append(composerName).append("");        output.append("Genre: ");        ArrayList selectedGenreList = null;        String genreName = "";        switch (genreChoice) {            case "1":                selectedGenreList = adventure;                genreName = "Adventure";                break;            case "2":                selectedGenreList = drama;                genreName = "Drama";                break;            case "3":                selectedGenreList = fantasy;                genreName = "Fantasy";                break;            case "4":                selectedGenreList = romance;                genreName = "Romance";                break;            case "5":                selectedGenreList = sciFi;                genreName = "Sci Fi";                break;            case "6":                selectedGenreList = thriller;                genreName = "Thriller";                break;            case "7":                selectedGenreList = war;                genreName = "War";                break;            default:                JOptionPane.showMessageDialog(null, "Invalid genre choice.");                return;        }        output.append(genreName).append("");        output.append("Movie TitleYear ReleasedRating");        if (selectedGenreList != null) {            for (Movie movie : selectedGenreList) {                output.append(String.format("%-20s%-15d%s",                                             movie.getTitle(),                                             movie.getYearReleased(),                                             movie.getRating()));            }        }        JOptionPane.showMessageDialog(null, output.toString());    }}

4.6 Main.java

import java.io.FileNotFoundException;public class Main {    public static void main(String[] args) throws FileNotFoundException {        Driver driver = new Driver();        driver.start();    }}

5. 注意事项与总结

数据清洗的重要性: 在从外部源(如文件、网络)读取数据时,始终假定数据可能不完全符合预期格式。对输入数据进行严格的验证和清洗是避免运行时错误的关键。String.trim() 和正则表达式是处理这类问题的强大工具异常处理: 在文件 I/O 和数据类型转换时,FileNotFoundException 和 NumberFormatException 是常见的受检异常。使用 try-catch 块进行适当的异常处理至关重要,这可以使程序更加健壮,并提供有用的错误信息。使用 try-with-resources 语句(如 try (Scanner myReader = new Scanner(myObj)))可以确保资源(如 Scanner)在使用完毕后自动关闭,避免资源泄漏。面向对象设计: 原始代码中 Movie extends Director 的继承关系在语义上可能不完全符合现实世界模型(电影通常“有”一个导演,而不是“是”一个导演)。在实际项目中,更好的设计可能是让 Movie 类包含一个 Director 类型的成员变量(组合关系),而不是继承关系。然而,本文主要关注数据解析和排序,因此保留了原有结构。格式化输出: 使用 String.format() 可以更灵活地控制输出字符串的格式,例如对齐文本、设置宽度等,以生成更美观的报告。代码可读性: 适当的注释、有意义的变量名和清晰的代码结构对于维护和理解代码至关重要。

通过上述改进,我们不仅解决了 ArrayList 为空和 NumberFormatException 的问题,还使文件数据处理流程更加健壮和专业。这对于任何需要处理外部数据的 Java 应用来说都是基本且重要的实践。

以上就是Java 文件解析与数据处理:解决 ArrayList 空值及排序问题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1034607.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
cssalign-items和justify-content属性使用
上一篇 2025年12月2日 02:54:31
真我GT6新功能AI传送门曝光
下一篇 2025年12月2日 02:54:32

相关推荐

  • composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

    require用于声明项目运行必需的依赖,如框架、数据库组件和第三方SDK,这些包会随项目部署到生产环境;2. require-dev用于声明仅在开发和测试阶段需要的工具,如PHPUnit、PHPStan、Faker等,不会默认部署到生产环境;3. 安装时composer install根据环境决定…

    2026年5月10日
    1000
  • 修复Django电商项目中AJAX过滤产品列表图片不显示问题

    在Django电商项目中,当使用AJAX动态加载过滤后的产品列表时,常遇到图片无法正常显示的问题。这通常是由于前端模板中图片加载方式(如data-setbg属性结合JavaScript库)与AJAX动态内容更新机制不兼容所致。解决方案是直接在AJAX返回的HTML中使用标准的标签来渲染图片,确保浏览…

    2026年5月10日
    000
  • Matplotlib 地图中多类型图例的创建与优化

    Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化

    本教程旨在解决matplotlib地图可视化中,如何在一个图例中同时展示颜色块(如区域分类)和自定义标记(如特定兴趣点)的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时,如何利用`matplotlib.lines.line2d`创建标记图例句柄,并将其与颜色块图例句柄合并,从而生成一…

    2026年5月10日 用户投稿
    100
  • Golang JSON序列化:控制敏感字段暴露的最佳实践

    本教程探讨golang中如何高效控制结构体字段在json序列化时的可见性。当需要将包含敏感信息的结构体数组转换为json响应时,通过利用`encoding/json`包提供的结构体标签,特别是`json:”-“`,可以轻松实现对特定字段的忽略,从而避免敏感数据泄露,确保api…

    2026年5月10日
    000
  • 利用海象运算符简化条件赋值:Python教程与最佳实践

    本文旨在探讨Python中海象运算符(:=)在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符,以及条件表达式,分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例,展示如何在列表推导式等场景下合理使用海象运算符,同时强调其潜在的复杂性及替代方案,帮助开发者更好地掌…

    2026年5月10日
    100
  • Debian syslog性能优化技巧有哪些

    提升Debian系统syslog (通常基于rsyslog)性能,关键在于精简配置和高效处理日志。以下策略能有效优化日志管理,提升系统整体性能: 精简配置,高效加载: 在rsyslog配置文件中,仅加载必要的输入、输出和解析模块。 使用全局指令设置日志级别和格式,避免不必要的处理。 自定义模板: 创…

    2026年5月10日
    000
  • 怎么在PHP代码中实现图片上传功能_PHP图片上传功能实现与安全处理教程

    首先创建含enctype的HTML表单,再用PHP接收文件,检查目录、移动临时文件,验证类型与大小,生成唯一文件名,并调整php.ini限制以确保上传成功。 如果您尝试在PHP项目中添加图片上传功能,但服务器无法正确接收或保存文件,则可能是由于表单配置、文件处理逻辑或安全限制的问题。以下是实现该功能…

    2026年5月10日
    100
  • 比特币新手教程 比特币交易平台有哪些

    比特币是一种去中心化的数字货币,基于区块链技术实现点对点交易,具有匿名性、有限发行和不可篡改等特点;新手可通过交易所购买,P2P交易获得比特币,常用平台包括Binance、OKX和Huobi;交易流程包括注册账户、实名认证、绑定支付方式、充值法币并下单购买,可选择市价单或限价单;比特币存储方式有交易…

    2026年5月10日
    000
  • c++中的SFINAE技术是什么_c++模板编程中的SFINAE原理与应用

    SFINAE 是“替换失败不是错误”的原则,指模板实例化时若参数替换导致错误,只要存在其他合法候选,编译器不报错而是继续重载决议。它用于条件启用模板、类型检测等场景,如通过 decltype 或 enable_if 控制函数重载,实现类型特征判断。尽管 C++20 引入 Concepts 简化了部分…

    2026年5月10日
    000
  • Go语言mgo查询构建:深入理解bson.M与日期范围查询的正确实践

    本文旨在解决go语言mgo库中构建复杂查询时,特别是涉及嵌套`bson.m`和日期范围筛选的常见错误。我们将深入剖析`bson.m`的类型特性,解释为何直接索引`interface{}`会导致“invalid operation”错误,并提供一种推荐的、结构清晰的代码重构方案,以确保查询条件能够正确…

    2026年5月10日
    100
  • vscode上怎么运行html_vscode上运行html步骤【指南】

    首先保存文件为.html格式,再通过浏览器或Live Server插件打开预览;推荐安装Live Server实现本地服务器运行与实时刷新,提升开发体验。 在 VS Code 上运行 HTML 文件并不需要复杂的配置,只需几个简单步骤即可预览页面效果。VS Code 本身是一个代码编辑器,不直接运行…

    2026年5月10日
    100
  • 修复点击时按钮抖动:CSS垂直对齐实践

    本文探讨了在Web开发中,交互式按钮(如播放/暂停按钮)在点击时发生意外垂直位移的问题。通过分析CSS样式变化对元素布局的影响,我们发现这是由于按钮不同状态下的边框样式和内边距改变,以及默认的垂直对齐行为共同作用所致。核心解决方案是利用CSS的vertical-align属性,将其设置为middle…

    2026年5月10日
    100
  • Golang goroutine与channel调试技巧

    使用go run -race检测数据竞争,结合runtime.NumGoroutine监控协程数量,通过pprof分析阻塞调用栈,利用select超时避免永久阻塞,有效排查goroutine泄漏、死锁和数据竞争问题。 Go语言的goroutine和channel是并发编程的核心,但它们也带来了调试上…

    2026年5月10日
    000
  • 使用 Jupyter Notebook 进行探索性数据分析

    Jupyter Notebook通过单元格实现代码与Markdown结合,支持数据导入(pandas)、清洗(fillna)、探索(matplotlib/seaborn可视化)、统计分析(describe/corr)和特征工程,便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

    2026年5月10日
    000
  • 《魔兽世界》将于6月11日开启国服回归技术测试

    《魔兽世界》将于6月11日开启国服回归技术测试《魔兽世界》将于6月11日开启国服回归技术测试《魔兽世界》将于6月11日开启国服回归技术测试《魔兽世界》将于6月11日开启国服回归技术测试

    《%ign%ignore_a_1%re_a_1%》官方宣布,将于6月11日开启国服回归技术测试,时间为7天,并称可以在6月内正式开服,玩家们可以访问官网下载战网客户端并预下载“巫妖王之怒”客户端,技术测试详情见下图。 WordAi WordAI是一个AI驱动的内容重写平台 53 查看详情 以上就是《…

    2026年5月10日 用户投稿
    200
  • 如何在HTML中插入表单元素_HTML表单控件与输入类型使用指南

    HTML表单通过标签构建,包含action和method属性定义数据提交目标与方式,常用input类型如text、password、email等适配不同输入需求,配合label、required、placeholder提升可用性,结合textarea、select、button等控件实现完整交互,是…

    2026年5月10日
    100
  • 前端缓存策略与JavaScript存储管理

    根据数据特性选择合适的存储方式并制定清晰的读写与清理逻辑,能显著提升前端性能;合理运用Cookie、localStorage、sessionStorage、IndexedDB及Cache API,结合缓存策略与定期清理机制,可在保证用户体验的同时避免安全与性能隐患。 前端缓存和JavaScript存…

    2026年5月10日
    200
  • 网站标题关键词更新后,搜索引擎为何仍显示旧标题?

    网站标题更新后,搜索引擎为何显示旧标题? 网站SEO优化中,站长常修改网站标题关键词,期望搜索结果显示自定义标题。然而,即使更新标签、meta keywords、meta description和结构化数据中的name属性后,搜索结果仍显示旧标题,这令人费解。本文将对此进行解释。 问题:站长修改了网…

    2026年5月10日
    100
  • HTML5网页如何实现手势操作 HTML5网页移动端交互的处理技巧

    首先利用原生touch事件实现滑动判断,再通过preventDefault解决滚动冲突,接着引入Hammer.js处理复杂手势,最后通过优化点击区域、避免事件冲突和增加视觉反馈提升体验。 在移动端浏览器中,HTML5网页可以通过触摸事件实现手势操作,提升用户体验。虽然原生JavaScript提供了基…

    2026年5月10日
    000
  • 创建指定大小并填充特定数据的Golang文件教程

    本文将介绍如何使用Golang创建一个指定大小的文件,并用特定数据填充它。我们将使用 `os` 包提供的函数来创建和截断文件,从而实现快速生成大文件的目的。示例代码展示了如何创建一个10MB的文件,并将其填充为全零数据。掌握这些方法,可以方便地在例如日志系统或磁盘队列等场景中,预先创建测试文件或初始…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信