如何用Node.js处理CSV和Excel文件?

使用papaparse、csv-parser和xlsx等库可高效处理Node.js中的CSV和Excel文件。1. 读取CSV可用csv-parser流式解析为JSON数组;2. 写入CSV可通过csv-writer将对象数组写入文件;3. 读取Excel使用xlsx库加载工作簿并转为JSON;4. 写入Excel则将JSON数据转换为工作表并保存为.xlsx文件;5. 大文件处理建议采用流式读取或转换为CSV以降低内存占用。

如何用node.js处理csv和excel文件?

处理CSV和Excel文件在Node.js中非常常见,尤其是在数据导入、导出或报表生成场景中。通过使用一些成熟的第三方库,可以轻松实现读取、写入和转换操作。

读取和写入CSV文件

CSV是一种简单高效的表格数据格式,Node.js中处理CSV推荐使用 papaparsecsv-parsercsv-writer 搭配。

● 安装依赖:

npm install csv-parser csv-writer

● 读取CSV文件:

使用 csv-parser 将CSV解析为JSON数组:

const fs = require('fs');const csv = require('csv-parser');const results = [];fs.createReadStream('data.csv')  .pipe(csv())  .on('data', (row) => {    results.push(row);  })  .on('end', () => {    console.log(results); // 打印所有行  });

● 写入CSV文件:

使用 csv-writer 将数据写入CSV:

const createCsvWriter = require('csv-writer').createObjectCsvWriter;const csvWriter = createCsvWriter({  path: 'output.csv',  header: [    {id: 'name', title: 'Name'},    {id: 'age', title: 'Age'}  ]});csvWriter.writeRecords([  {name: 'Alice', age: 25},  {name: 'Bob', age: 30}]).then(() => console.log('CSV文件已生成'));

读取和写入Excel文件

Excel文件(.xlsx)结构更复杂,推荐使用 xlsx 库(也叫 SheetJS),它支持多种格式且无需依赖Office软件。

● 安装依赖:

npm install xlsx

● 读取Excel文件:

加载Excel文件并提取第一个工作表的数据:

const XLSX = require('xlsx');// 读取文件const workbook = XLSX.readFile('data.xlsx');const sheetName = workbook.SheetNames[0]; // 取第一个工作表const worksheet = workbook.Sheets[sheetName];// 转为JSON数组const data = XLSX.utils.sheet_to_json(worksheet);console.log(data);

● 写入Excel文件:

将JSON数据写入新的Excel文件:

const XLSX = require('xlsx');const data = [  {姓名: '张三', 年龄: 28},  {姓名: '李四', 年龄: 32}];// 创建工作表const worksheet = XLSX.utils.json_to_sheet(data);// 创建工作簿const workbook = XLSX.utils.book_new();XLSX.utils.book_append_sheet(workbook, worksheet, '用户数据');// 写入文件XLSX.writeFile(workbook, 'output.xlsx');

处理大型文件的建议

对于大体积的CSV或Excel文件,避免一次性加载全部内容到内存。

● CSV:使用流式处理(如 csv-parser 的 pipe 方式)逐行读取。● Excel:xlsx 库默认全加载,若文件过大可考虑先转为CSV再处理,或使用支持流式解析的工具exceljs。● 控制内存使用:处理完一批数据后及时清除引用,避免内存泄漏。基本上就这些。选择合适的方法取决于文件类型、大小和业务需求。CSV适合轻量级结构化数据,Excel适合带格式或多个工作表的场景。

以上就是如何用Node.js处理CSV和Excel文件?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1528988.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月20日 20:44:15
下一篇 2025年12月20日 20:44:25

相关推荐

  • 如何通过JavaScript控制无人机或物联网设备?

    JavaScript可通过WebSocket或HTTP与物联网设备通信,实现无人机控制;2. Node.js结合serialport、MQTT等库可直接与硬件交互;3. 前端可利用Web Bluetooth或WebUSB实验性API连接蓝牙或USB设备;4. 典型架构为前端发指令、Node.js中转…

    2025年12月20日
    000
  • JavaScript中的Web Assembly(Wasm)如何与JavaScript交互?

    JavaScript与Wasm通过函数调用、共享内存和数据序列化实现高效交互:1. JS调用Wasm导出函数;2. Wasm调用JS导入函数;3. 共享线性内存传递数据;4. 手动处理字符串等复杂类型。 WebAssembly(Wasm)是一种低级字节码格式,能在现代浏览器中以接近原生速度运行。它并…

    2025年12月20日
    000
  • JavaScript中闭包的工作原理及其常见应用场景有哪些?

    闭包是函数与其词法作用域的组合,能记住并访问外部变量,即使在外层函数执行后仍保持引用。如 inner 函数保留对 count 的访问,实现计数器;常用于数据私有化(如模块模式)、回调中保存上下文、函数柯里化(如 add(5) 记住参数)及防抖节流(闭包保存 timer)。需注意避免因长期引用导致内存…

    2025年12月20日
    000
  • 如何利用JavaScript进行机器学习模型的推理和部署?

    JavaScript可通过TensorFlow.js在浏览器或Node.js中加载预训练模型进行推理,支持图像分类等任务,需将Python训练的模型转换为model.json格式,适用于实时处理、低延迟交互和离线场景,但应轻量化模型并优化加载与内存管理。 JavaScript 虽然不是传统意义上的机…

    2025年12月20日
    000
  • 使用 JavaScript 和 ApexCharts 实现数据动态追加与实时更新

    本文将介绍如何使用 JavaScript 和 ApexCharts 库,实现每隔固定时间向图表中动态追加数据的功能。通过 `setInterval` 函数,我们可以定时更新图表数据,从而实现数据的实时展示。文章将提供详细的代码示例和步骤说明,帮助开发者快速掌握该技术。 需求分析 我们的目标是创建一个…

    2025年12月20日
    000
  • 使用手机访问React和Node聊天系统时后端连接问题的解决方案

    本文旨在解决React和Node构建的聊天系统在手机端访问时,前端可以正常显示但后端连接失败的问题。通过分析可能的原因,并提供修改前端API调用地址以及使用端口转发工具的解决方案,帮助开发者顺利在移动端测试和使用他们的聊天应用。 问题分析 当你在电脑上使用 localhost 运行React和Nod…

    2025年12月20日
    000
  • 使用 apicache-plus 实现 API 缓存的精细化管理与清除

    本教程详细介绍了如何利用 `apicache-plus` 包在 Node.js 应用中实现高效的 API 缓存管理。文章将重点阐述如何通过设置缓存组(`apicacheGroup`)来对特定路由的缓存进行分组,并演示如何从其他路由精确地清除这些分组缓存,从而解决传统 `apicache` 包在精细化…

    2025年12月20日
    000
  • JavaScript中基于对象属性动态计算另一属性值:使用Getter实现

    本文探讨如何在javascript对象中,实现一个属性的值基于同一对象内其他属性进行动态计算,同时避免显式函数调用。我们将深入分析常见误区,并重点介绍如何利用javascript的getter特性,以优雅且符合直觉的方式,创建出行为如同普通属性的“计算属性”,从而实现代码的简洁性与响应性。 在Jav…

    2025年12月20日
    000
  • Django 迁移后仍出现 INTEGRITY ERROR:列已不存在的解决方案

    本文旨在解决 Django 项目中,在模型字段删除并执行迁移后,仍然出现 `IntegrityError`,提示某列(已删除)违反非空约束的问题。我们将探讨问题原因,并提供详细的排查和修复步骤,确保数据一致性和应用正常运行。 在 Django 开发过程中,我们经常需要修改模型(models.py)并…

    2025年12月20日
    000
  • Chrome 扩展无法在某些 URL 上重定向的解决方案

    本教程旨在解决 Chrome 扩展在特定 URL 上无法进行重定向的问题。通过检查 manifest.json 文件中的匹配规则,并使用通配符进行更广泛的 URL 匹配,可以确保扩展程序在目标网站上正常工作。本文将提供详细的步骤和示例代码,帮助开发者解决类似问题,并确保扩展程序的预期行为。 在使用 …

    2025年12月20日
    000
  • 使用 JavaScript 更新输入值到元素

    本文档旨在指导开发者如何使用 JavaScript 将输入框中的值动态更新到页面元素中,并提供代码示例和最佳实践。我们将探讨如何获取输入值、创建和更新元素,以及如何利用表单和本地存储优化用户体验。 动态更新元素内容 在网页开发中,经常需要根据用户的输入动态更新页面上的元素。以下是一个基础示例,演示了…

    2025年12月20日
    000
  • TypeORM与PostgreSQL中的索引策略:自动创建、显式定义与优化实践

    本教程深入探讨typeorm在postgresql数据库中管理索引的机制。我们将分析typeorm何时自动创建索引(如主键和唯一约束),以及如何使用`@index()`装饰器显式定义单个列或复合索引。文章还将详细比较复合索引与单个索引的适用场景,并提供最佳实践,帮助开发者有效优化数据库查询性能,避免…

    2025年12月20日
    000
  • 在TypeORM中高效使用PostgreSQL索引

    本教程深入探讨了TypeORM与PostgreSQL数据库中索引的创建与管理。文章详细阐述了TypeORM在何种情况下会自动生成索引(如主键和唯一约束),以及在关系型字段上需要手动使用`@Index`装饰器创建索引的重要性。同时,教程还比较了独立索引与复合索引的优劣,并提供了实践建议,帮助开发者根据…

    2025年12月20日
    000
  • 如何实现一个支持实时协作的富文本编辑器?

    实现实时协作富文本编辑器需解决内容同步、冲突处理和多人光标展示问题,核心路径为选用Tiptap+Yjs+WebRTC技术栈,通过CRDT算法实现自动冲突合并,WebSocket或WebRTC传输操作,Yjs支持协同感知与光标同步,结合服务端持久化与权限控制,构建低延迟、高可靠协作体验。 实现一个支持…

    2025年12月20日
    000
  • 如何用正则表达式处理复杂的文本匹配场景?

    正则表达式需分步构建,先分析文本结构与边界,利用锚点、分组和命名捕获提升精度,结合单行或多行模式处理特殊字符,使用前瞻后顾限定上下文,并配合代码二次筛选以应对复杂匹配。 处理复杂的文本匹配时,正则表达式是一个强大工具,但需要合理设计模式以应对多样性与不确定性。关键是理解文本结构、边界情况,并组合使用…

    2025年12月20日
    000
  • 如何构建一个支持实时协作的在线文档编辑器?

    构建在线文档编辑器需实现多用户实时同步,核心是采用CRDT或OT算法确保一致性,推荐使用CRDT(如Yjs)因逻辑清晰易扩展,并通过WebSocket建立低延迟双向通信,保障操作实时传输与响应。 要构建一个支持实时协作的在线文档编辑器,核心在于实现多用户同时编辑时内容的一致性与低延迟同步。关键技术包…

    2025年12月20日
    000
  • 如何用Nuxt.js实现服务端渲染的优化策略?

    启用现代模式、合理使用asyncData与fetch、开启gzip/Brotli压缩、优化关键资源加载、利用缓存策略,可显著提升Nuxt.js应用的SSR性能和首屏加载速度。 在使用 Nuxt.js 构建高性能的 Vue 应用时,服务端渲染(SSR)是提升首屏加载速度和 SEO 效果的关键。要真正发…

    2025年12月20日
    000
  • 精通 apicache-plus:实现 Node.js 路由缓存的条件性清除

    本文详细介绍了如何在 node.js 应用中,利用 `apicache-plus` 库实现路由级别的缓存管理,特别是如何通过缓存分组(`apicachegroup`)机制,在特定路由数据更新后,精确地清除关联的缓存数据。通过示例代码,演示了缓存的配置、分组的设置以及按需失效缓存的实现方法,确保数据的…

    2025年12月20日
    000
  • 使用递归函数统计JavaScript嵌套对象与数组数量的教程

    本文深入探讨如何使用JavaScript递归函数来统计复杂嵌套对象中的对象和数组数量。重点解析递归过程中计数变量的累加机制,特别是count++和count += recursiveCall()的协同作用,帮助读者理解如何有效聚合子树的统计结果,从而处理多层级数据结构。 引言:处理复杂嵌套数据结构的…

    2025年12月20日
    000
  • 利用透明覆盖层在CSS过渡期间获取元素的最终鼠标位置

    本文旨在解决javascript中event.offsetx和event.offsety在元素进行css缩放过渡时,无法立即获取元素最终状态下鼠标位置的问题。通过引入一个无过渡的透明覆盖层来捕获鼠标事件,并使其与目标元素同步缩放,我们能够准确地获取到动画结束时鼠标相对于元素的最终偏移量,从而优化用户…

    2025年12月20日
    000

发表回复

登录后才能评论
关注微信