如何使用Java导入Excel文件 Java读取Excel数据的方法

在java中导入和读取excel文件最常用的是%ignore_a_1% poi库,1. 首先通过maven添加poi和poi-ooxml依赖;2. 使用workbookfactory.create()加载excel文件并自动识别格式;3. 遍历sheet、row和cell获取数据;4. 根据celltype判断单元格类型并处理字符串、数字、日期、公式等不同类型;5. 通过try-catch捕获ioexception和invalidformatexception处理文件异常;6. 对于大型excel文件使用sax解析器实现流式读取避免内存溢出;7. 将读取的数据映射到pojo对象后,可通过jdbc、mybatis等工具批量插入数据库完成持久化。

如何使用Java导入Excel文件 Java读取Excel数据的方法

在Java中导入和读取Excel文件,最常用且功能强大的库无疑是Apache POI。它提供了一整套API,能够处理Microsoft Office格式的文件,无论是老式的.xls还是新式的.xlsx,都能游刃有余地应对。简单来说,就是通过这个工具包,我们能像操作普通数据结构一样,读取Excel里的每一个单元格内容。

如何使用Java导入Excel文件 Java读取Excel数据的方法

解决方案

要使用Java读取Excel数据,核心步骤可以概括为:引入Apache POI库,加载Excel文件,然后遍历工作表、行和单元格来获取数据。

首先,你需要在你的项目构建工具中添加Apache POI的依赖。如果你用Maven,大概是这样:

立即学习“Java免费学习笔记(深入)”;

如何使用Java导入Excel文件 Java读取Excel数据的方法

    org.apache.poi    poi    5.2.3     org.apache.poi    poi-ooxml    5.2.3 

接下来,就是编写读取逻辑了。一个基本的读取流程是这样的:

import org.apache.poi.ss.usermodel.*;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStream;import java.util.Iterator;public class ExcelReaderExample {    public static void readExcel(String filePath) {        try (InputStream excelFile = new FileInputStream(filePath)) {            // 根据文件类型创建不同的工作簿对象            // WorkbookFactory.create(InputStream) 可以自动识别.xls和.xlsx            Workbook workbook = WorkbookFactory.create(excelFile);            // 获取第一个工作表,或者通过名称获取            Sheet sheet = workbook.getSheetAt(0); // 获取第一个sheet            // Sheet sheet = workbook.getSheet("Sheet1"); // 通过名称获取            // 遍历所有行            Iterator rowIterator = sheet.iterator();            while (rowIterator.hasNext()) {                Row currentRow = rowIterator.next();                // 跳过标题行,如果你有的话                // if (currentRow.getRowNum() == 0) {                //     continue;                // }                // 遍历当前行的所有单元格                Iterator cellIterator = currentRow.iterator();                while (cellIterator.hasNext()) {                    Cell currentCell = cellIterator.next();                    // 根据单元格类型获取值                    switch (currentCell.getCellType()) {                        case STRING:                            System.out.print(currentCell.getStringCellValue() + "t");                            break;                        case NUMERIC:                            // 处理日期和数字                            if (DateUtil.isCellDateFormatted(currentCell)) {                                System.out.print(currentCell.getDateCellValue() + "t");                            } else {                                System.out.print(currentCell.getNumericCellValue() + "t");                            }                            break;                        case BOOLEAN:                            System.out.print(currentCell.getBooleanCellValue() + "t");                            break;                        case FORMULA:                            // 对于公式,可以尝试获取其计算结果                            System.out.print(currentCell.getCellFormula() + " -> " + currentCell.getNumericCellValue() + "t");                            break;                        case BLANK:                            System.out.print("[空白]t");                            break;                        default:                            System.out.print("[未知类型]t");                    }                }                System.out.println(); // 换行            }        } catch (IOException e) {            System.err.println("文件读取错误: " + e.getMessage());        } catch (org.apache.poi.openxml4j.exceptions.InvalidFormatException e) {            System.err.println("Excel文件格式错误: " + e.getMessage());        }    }    public static void main(String[] args) {        String filePath = "path/to/your/excel_file.xlsx"; // 替换为你的Excel文件路径        readExcel(filePath);    }}

这段代码涵盖了读取Excel文件的基本流程,包括如何打开文件、遍历工作表、行和单元格,并根据单元格类型获取其内容。WorkbookFactory.create()是个非常方便的方法,它能自动判断你的Excel文件是.xls还是.xlsx格式,并创建相应的HSSFWorkbookXSSFWorkbook实例。

如何使用Java导入Excel文件 Java读取Excel数据的方法

Java读取Excel文件时如何处理不同数据类型和潜在错误?

说实话,刚开始接触Excel处理,最让人头疼的就是数据类型转换和那些莫名其妙的空指针异常。Excel单元格的数据类型远比我们想象的要复杂,它不只是简单的字符串或数字。POI提供了CellType枚举来表示这些类型:STRINGNUMERIC(包含数字和日期)、BOOLEANFORMULABLANKERROR

处理不同数据类型,关键在于使用currentCell.getCellType()判断当前单元格的实际类型,然后调用对应的方法(如getStringCellValue()getNumericCellValue()等)来获取值。特别要注意的是数字类型,Excel中日期也是以数字形式存储的,所以你需要用DateUtil.isCellDateFormatted(cell)来判断是否为日期,然后用getDateCellValue()获取。否则,你可能会得到一串看起来毫无意义的浮点数。

至于潜在错误,文件不存在、路径错误、文件被占用、Excel文件本身损坏或格式不正确都是常见的坑。使用try-catch块来捕获IOException(文件读写问题)和InvalidFormatException(Excel文件格式问题)是必不可少的。另外,在遍历单元格时,如果某个单元格是空的(BLANK类型),直接调用getStringCellValue()等方法可能会抛出NullPointerException,所以最好在获取值之前进行null检查或者确保你的逻辑能够处理BLANK类型。

我的经验是,在实际项目中,我会封装一个工具类,针对不同列的数据类型做更精细的判断和转换,比如有些看起来是数字的列,实际上我们希望它被当作字符串来处理(比如商品编码),这时候就不能简单地用getNumericCellValue()了,可能需要先尝试getStringCellValue(),如果不行再尝试其他方式。这种灵活性是处理真实世界Excel数据时必须考虑的。

大型Excel文件在Java中如何高效读取,避免内存溢出?

处理大型Excel文件,特别是.xlsx格式的,是个常见的挑战。默认的XSSFWorkbook实现会将整个Excel文件加载到内存中。如果你的文件有几十万甚至上百万行数据,这很容易导致OutOfMemoryError。这就像你试图把一个巨型图书馆的所有书都搬到你家客厅一样,显然不现实。

为了解决这个问题,Apache POI提供了SXSSFWorkbook(Streaming Usermodel API for XSSF)。SXSSFWorkbookXSSFWorkbook的一个流式版本,它通过在磁盘上创建临时文件来存储行数据,而不是全部加载到内存中。当你创建了指定数量的行后,旧的行就会被写入磁盘,从而释放内存。

使用SXSSFWorkbook进行读取(虽然它主要用于写入,但其背后的流式思想在读取时也需要借鉴):对于读取,我们不能直接用SXSSFWorkbook来读。而是要使用XSSF and SAX (Streaming API for XML)。POI提供了SAX解析器,它不会一次性加载整个工作簿,而是逐个事件地解析XML结构(因为.xlsx文件本质上是XML文件)。

你需要自己实现一个XSSFSheetXMLHandler.SheetContentsHandler接口,来处理解析过程中遇到的各种事件,比如行开始、行结束、单元格值等。这个方法相对复杂,但对于超大型文件来说,是避免内存溢出的最佳实践。

// 这是一个简化的概念性示例,实际使用需要更复杂的逻辑// 引入相关类:// import org.apache.poi.xssf.eventusermodel.XSSFReader;// import org.apache.poi.xssf.eventusermodel.XSSFSheetXMLHandler;// import org.apache.poi.xssf.usermodel.XSSFComment;// import org.xml.sax.InputSource;// import org.xml.sax.XMLReader;// import javax.xml.parsers.SAXParserFactory;public class LargeExcelReader {    public void readLargeExcel(String filePath) throws Exception {        // ... SAX解析器设置和事件处理逻辑 ...        // 核心思想是:不把所有数据都读到内存里,而是读一行处理一行        // 伪代码:        // XSSFReader xssfReader = new XSSFReader(OPCPackage.open(filePath));        // XSSFSheetXMLHandler handler = new XSSFSheetXMLHandler(        //     xssfReader.getStylesTable(), null, new MySheetContentsHandler(), false);        // XMLReader parser = SAXParserFactory.newInstance().newSAXParser().getXMLReader();        // parser.setContentHandler(handler);        // parser.parse(new InputSource(xssfReader.getSheetsData().next()));    }    // MySheetContentsHandler 需要实现 XSSFSheetXMLHandler.SheetContentsHandler 接口    // 在startRow()和endRow()中处理行数据,在cell()中处理单元格数据}

简而言之,对于大文件,不要指望一次性把所有数据都塞进内存。采用流式处理(SAX解析)或者分批处理的策略,读一行处理一行,或者读一小段处理一小段,才是王道。这虽然增加了代码的复杂性,但能确保程序的稳定性和扩展性。

如何将Java读取的Excel数据映射到业务对象或持久化到数据库?

读取Excel数据往往不是目的,而是手段。最终我们通常需要将这些数据转换成程序中可操作的Java对象,或者直接存储到数据库中。

映射到业务对象(POJO):这是最常见的做法。假设你的Excel文件有“姓名”、“年龄”、“邮箱”三列,你可以创建一个对应的Java类:

public class User {    private String name;    private int age;    private String email;    // 构造函数、getter、setter...    public User(String name, int age, String email) {        this.name = name;        this.age = age;        this.email = email;    }    // 省略getter/setter}

然后在读取Excel的循环中,为每一行创建一个User对象,并将单元格数据设置到对象的属性中。

List userList = new ArrayList();// ... 在Excel读取循环中 ...Row currentRow = rowIterator.next();// 假设第一列是姓名,第二列是年龄,第三列是邮箱String name = currentRow.getCell(0).getStringCellValue();int age = (int) currentRow.getCell(1).getNumericCellValue();String email = currentRow.getCell(2).getStringCellValue();userList.add(new User(name, age, email));// ...

这种方式清晰直观,将原始的表格数据结构化为程序可理解的对象,方便后续的业务逻辑处理。

持久化到数据库:将Excel数据导入数据库,通常是在将数据映射到POJO之后进行。你可以遍历userList,然后使用JDBC、MyBatis、Hibernate等工具将每个User对象的数据插入到数据库表中。

为了提高效率,特别是数据量大的时候,强烈建议使用JDBC的批量插入(Batch Insert)。而不是每读取一行就执行一次INSERT语句。批量插入可以显著减少数据库连接和网络往返的开销。

// 伪代码,使用JDBC批量插入// Connection conn = null;// PreparedStatement pstmt = null;// try {//     conn = DriverManager.getConnection("jdbc:mysql://localhost:3306/mydb", "user", "password");//     conn.setAutoCommit(false); // 关闭自动提交,进行手动提交//     String sql = "INSERT INTO users (name, age, email) VALUES (?, ?, ?)";//     pstmt = conn.prepareStatement(sql);////     for (User user : userList) { // 假设userList已经从Excel中读取并填充//         pstmt.setString(1, user.getName());//         pstmt.setInt(2, user.getAge());//         pstmt.setString(3, user.getEmail());//         pstmt.addBatch(); // 添加到批处理//     }////     pstmt.executeBatch(); // 执行批处理//     conn.commit(); // 提交事务// } catch (SQLException e) {//     conn.rollback(); // 出现异常回滚//     e.printStackTrace();// } finally {//     // 关闭资源// }

整个流程下来,从文件读取到数据入库,形成了一个完整的闭环。实际操作中,错误处理、数据校验、以及更复杂的业务逻辑(比如数据去重、转换规则)都是需要重点考虑的环节。但核心思路,就是一步步将原始数据“洗干净”,然后放到它该去的地方。

以上就是如何使用Java导入Excel文件 Java读取Excel数据的方法的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/130693.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月28日 13:08:05
下一篇 2025年11月28日 13:28:03

相关推荐

  • PHP中的JWT:如何实现无状态身份验证

    在php中实现jwt无状态身份验证的解决方案包括以下步骤:1. 安装jwt库,推荐使用firebase/php-jwt并通过composer安装;2. 用户登录成功后生成jwt,包含header、payload和signature三部分,其中payload应包含iss、aud、iat、nbf、exp…

    2025年12月10日 好文分享
    000
  • PHP执行MySQL查询语句 PHP源码操作数据库实例

    使用php执行mysql查询需注意安全与性能。核心步骤包括建立连接、构造sql语句和处理结果。为防止sql注入,应使用预处理语句和参数绑定,如pdo或mysqli扩展实现参数化查询。对于大量数据,可禁用缓冲查询逐行处理或采用分页查询。此外,优化索引、避免select *、使用join代替子查询、缓存…

    2025年12月10日 好文分享
    000
  • PHP并发编程:Swoole扩展入门

    swoole 解决了 php 高并发处理能力弱的问题,通过提供异步、事件驱动的网络通信能力,如 tcp/udp、http、websocket 服务器等,使 php 可以像 go、node.js 一样高效处理高并发请求;传统 php 每次请求都需要启动独立进程,资源消耗大,而 swoole 允许 ph…

    2025年12月10日 好文分享
    000
  • PHP怎样解析XZ压缩文件 XZ格式解压缩完整流程

    解释一下: 这个例子使用了proc_open函数,可以更细粒度地控制进程的输入输出。我们通过管道(pipe)读取xz命令的标准输出,然后分块写入到输出文件中。这样可以避免一次性加载整个文件到内存中。 mb_convert_encoding()函数可以进行编码转换。你需要将GBK替换成实际的原始编码。…

    好文分享 2025年12月10日
    000
  • PHP怎样处理SAML协议 SAML认证流程的5个关键步骤

    saml认证流程的5个关键步骤是:1.用户尝试访问受保护资源;2.重定向到身份提供商(idp);3.用户在idp处进行身份验证;4.idp发送saml断言给sp;5.sp验证saml断言并授予访问权限。php实现saml认证依赖onelogin的php-saml库,需配置sp和idp元数据,包括实体…

    2025年12月10日 好文分享
    000
  • PHP怎样删除文件 PHP删除文件的3种错误处理方式

    php中删除文件需谨慎使用unlink()函数,首先要检查文件是否存在,使用file_exists()函数判断;其次确认目标不是目录,用is_dir()检测;接着确保php进程有足够权限,可通过is_writable()或尝试touch()测试;若权限不足,可使用chmod()调整或联系运维处理;并…

    2025年12月10日 好文分享
    000
  • PHP如何调用Prettier格式化 Prettier代码格式化步骤解析

    在php项目中,虽然prettier不直接支持php代码格式化,但可以通过工具链间接实现。1. 安装prettier和php格式化工具如php-cs-fixer;2. 配置php-cs-fixer的规则文件以定义代码风格;3. 运行php-cs-fixer命令格式化php代码;4. 创建脚本结合ph…

    2025年12月10日 好文分享
    000
  • PHP怎么处理表单数据 PHP表单数据处理的安全技巧分享

    php处理表单数据需接收、验证和安全处理。1.使用$_post或$_get接收数据,$_post适合敏感信息,$_get适合非敏感信息;2.用filter_var等函数验证数据格式,如邮箱验证;3.防sql注入应使用预处理语句绑定参数,使恶意代码失效;4.防xss攻击可用htmlspecialcha…

    2025年12月10日 好文分享
    000
  • PHP如何获取内核崩溃日志 内核崩溃日志获取教程

    要获取php内核崩溃日志,1)检查操作系统日志:linux系统查看/var/log/syslog或/var/log/messages并用grep php过滤;windows系统使用事件查看器查找应用程序或系统日志。2)启用并检查php错误日志:在php.ini中设置error_log路径并确保dis…

    2025年12月10日 好文分享
    000
  • PHP中strtotime和DateTime的日期解析差异

    strtotime和datetime在处理日期时有明显差异。1. strtotime更轻量,适用于简单解析,返回unix时间戳;2. datetime提供更强大功能,返回对象并支持格式化、时区调整等;3. strtotime容错性强但可能导致意外结果,datetime解析更严格;4. strtoti…

    2025年12月10日 好文分享
    000
  • 详解PHP向MySQL表添加记录的教程

    要使用php向mysql表添加记录并防止sql注入,需采用预处理语句和参数化查询。1. 建立数据库连接,使用mysqli或pdo扩展;2. 构造insert语句,通过预处理将sql结构与数据分离,防止恶意代码注入;3. 使用bind_param(mysqli)或bindparam(pdo)绑定参数,…

    2025年12月10日 好文分享
    000
  • PHP中的协程调度:如何实现非阻塞IO操作

    php中的协程调度通过事件循环、非阻塞io、协程切换和状态管理实现高效io处理。1.事件循环负责监听io事件并唤醒相应协程;2.非阻塞io避免进程阻塞,返回错误码而非等待;3.协程切换在io无法立即完成时挂起当前协程,交由事件循环调度;4.状态管理维护协程运行、挂起等状态。选择框架时,swoole适…

    2025年12月10日 好文分享
    000
  • PHP中filter_var和preg_match的验证区别

    filter_var适用于验证标准格式数据,如邮箱、url等,使用简单且性能好;preg_match适用于复杂自定义格式,灵活性高。例如验证邮箱用filter_var更可靠高效,而验证特定规则的用户名或密码则需preg_match。两者也可结合使用:先用filter_var验证基础类型,再用preg…

    2025年12月10日 好文分享
    000
  • PHP怎么实现数据缓存雪崩 缓存雪崩预防方案分享

    缓存雪崩问题的解决核心在于避免缓存同时失效,从而让请求错峰访问数据库。1. 设置不同过期时间:为每个缓存项设置随机过期时间,避免集体失效;2. 互斥锁机制:缓存失效时只允许一个请求重建缓存,其他请求等待;3. 双 key 策略:使用两个 key 存储数据,正常 key 失效后可从短 key 获取数据…

    2025年12月10日 好文分享
    000
  • PHP如何获取系统语言设置 系统语言获取技巧实现多语言适配

    php获取系统语言设置的方法是通过读取$_server[‘http_accept_language’],解析用户首选语言并实现多语言适配。1.首先从http请求头提取accept-language信息,2.解析语言列表及其优先级q值,3.选择质量值最高的语言作为首选语言,4.…

    2025年12月10日 好文分享
    000
  • PHP如何调用Haskell程序 通过FFI调用Haskell函数的方法

    php调用haskell程序的方法是通过ffi机制,首先将haskell代码编译为动态链接库,再在php中使用ffi扩展加载并调用该库的函数;具体步骤如下:1. haskell编写函数并添加foreign export声明,2. 使用ghc带-shared和-fpic选项编译成.so或.dll文件,…

    2025年12月10日 好文分享
    000
  • PHP中的ORM:如何使用Eloquent操作数据库

    eloquent orm是laravel框架默认的数据库交互方式,通过模型实现面向对象的crud操作,减少sql编写。1. 安装配置:laravel内置无需安装,配置.env数据库信息并运行迁移命令即可;2. 创建模型:使用artisan命令生成模型并可指定对应表名;3. crud操作:支持查询、新…

    2025年12月10日 好文分享
    000
  • PHP怎样解析TXT文本数据 5个TXT文本处理函数使用示例

    解析txt文件需选合适函数与策略。1.小文件可用file()快速读取至数组;2.大文件推荐fopen()+fgets()逐行处理;3.csv格式用fgetcsv()解析;4.自定义分隔符可用explode();5.复杂分割使用strtok();6.处理大文件避免内存溢出可逐行释放或用生成器;7.不同…

    2025年12月10日 好文分享
    000
  • PHP怎么实现数据自动分析 数据自动分析的4种实现方案

    php实现数据自动分析的4种方案:方案一为定时脚本,适合简单统计但扩展性差;方案二引入数据分析库如php-ml,提升分析效率;方案三对接tableau等平台,可视化强但需付费;方案四结合消息队列如kafka,实现实时分析但架构复杂。数据清洗可用php函数或正则表达式处理,性能优化可通过数据库连接扩展…

    2025年12月10日 好文分享
    000
  • PHP调试技巧:Xdebug配置与使用

    php调试核心工具是xdebug,其配置主要包括设置xdebug.mode、xdebug.client_host与xdebug.client_port。1. 安装xdebug可通过pecl install xdebug或dockerfile添加扩展;2. 配置php.ini启用zend_extens…

    2025年12月10日 好文分享
    000

发表回复

登录后才能评论
关注微信