NodeJS Streams:在 Pipeline 中优雅地提前结束读取流

nodejs streams:在 pipeline 中优雅地提前结束读取流

本文探讨了在使用 NodeJS Streams 的 pipeline 处理大型文件时,如何在满足特定条件后提前结束读取流,同时确保已读取的数据块能够完成处理。文章提供了两种解决方案:一种是在转换流中“吞噬”后续数据,另一种是利用 AbortController 中止 pipeline,并详细讲解了实现方法和注意事项,旨在帮助开发者更有效地处理流数据。

在使用 NodeJS streams 的 pipeline 处理大型文件时,有时需要在特定条件满足时提前结束读取流,但同时又希望已读取的数据块能够继续完成处理。直接销毁读取流可能会导致 ERR_STREAM_PREMATURE_CLOSE 错误,并且不够优雅。本文将介绍两种更佳的解决方案,帮助你安全且高效地实现这一需求。

方案一:在转换流中“吞噬”后续数据

这种方法的核心思想是在检测到需要停止读取的条件后,让转换流“吞噬”后续的所有数据,使其不再向下传递。这样,读取流会一直读取到文件末尾,但下游的流只处理到满足停止条件之前的数据。

以下是示例代码:

const { Transform } = require("node:stream");const { pipeline } = require("node:stream/promises");const fs = require("node:fs");let shouldStop = false;const firstStream = fs.createReadStream("./lg.txt");const secondStream = new Transform({    transform(chunk, encoding, callback) {        if (shouldStop) {            // 吞噬剩余数据            callback(null, "");        } else {            const text = chunk.toString();            const foundText = text.search("CHAPTER 9") !== -1;            if (foundText) {                // 设置标志位,吞噬剩余数据                shouldStop = true;            }            callback(null, text.toUpperCase());        }    },});const lastStream = process.stdout;pipeline(firstStream, secondStream, lastStream)    .then(() => console.log("Pipeline completed successfully."))    .catch(err => console.error("Pipeline failed.", err));

代码解释:

shouldStop 变量用于标记是否需要停止处理数据。在 secondStream 的 transform 函数中,如果 shouldStop 为 true,则直接调用 callback(null, “”),表示吞噬当前数据块,不向下传递。如果 shouldStop 为 false,则检查当前数据块中是否包含目标文本。如果包含,则设置 shouldStop 为 true,并对数据进行转换后向下传递。

优点:

逻辑简单,易于理解和实现。不需要中断 pipeline,避免了潜在的错误。

缺点:

读取流会一直读取到文件末尾,可能会浪费一些资源。

方案二:使用 AbortController 中止 Pipeline

AbortController 提供了一种更优雅的方式来中止 pipeline,并且可以进行清理工作。通过 AbortController,可以向 pipeline 发送一个中止信号,pipeline 会在完成当前数据块的处理后停止。

以下是示例代码:

const { Transform } = require("node:stream");const { pipeline } = require("node:stream/promises");const fs = require("node:fs");const firstStream = fs.createReadStream("./lg.txt");const ac = new AbortController();const signal = ac.signal;const secondStream = new Transform({    transform(chunk, encoding, callback) {        const text = chunk.toString();        const foundText = text.search("CHAPTER 9") !== -1;        callback(null, text.toUpperCase());        if (foundText) {            ac.abort(new Error("reading terminated, match found"));        }    },});const lastStream = process.stdout;pipeline(firstStream, secondStream, lastStream, { signal }).then(() => {    console.log("nall done without match");}).catch((err) => {    if (err.code === "ABORT_ERR") {        console.log(`n${signal.reason.message}`);    } else {        console.log(err);    }});

代码解释:

创建 AbortController 实例 ac,并获取其 signal 属性。在 secondStream 的 transform 函数中,如果检测到目标文本,则调用 ac.abort(new Error(“reading terminated, match found”)),发送中止信号。在调用 pipeline 函数时,将 signal 作为选项传递。使用 try…catch 捕获 pipeline 函数可能抛出的错误。如果错误代码为 ABORT_ERR,则表示 pipeline 被中止,可以获取中止原因。

优点:

更优雅地中止 pipeline,可以进行清理工作。可以获取中止原因,方便调试。

缺点:

代码相对复杂一些。

注意事项:

跨 Chunk 边界问题: 在搜索目标文本时,需要注意目标文本可能跨越 chunk 边界的情况。为了避免漏检,可以保留每个 chunk 的最后 N-1 个字符,并将其添加到下一个 chunk 的开头,其中 N 为目标文本的长度。错误处理: 在使用 pipeline 函数时,需要注意错误处理。可以使用 try…catch 语句捕获可能抛出的错误,并进行相应的处理。资源释放: 在中止 pipeline 后,需要确保所有资源都得到正确释放。

总结

本文介绍了两种在 NodeJS Streams 的 pipeline 中提前结束读取流的解决方案。第一种方案是在转换流中“吞噬”后续数据,逻辑简单,但可能会浪费一些资源。第二种方案是使用 AbortController 中止 pipeline,更优雅,可以进行清理工作,但代码相对复杂。选择哪种方案取决于具体的应用场景和需求。同时,需要注意跨 chunk 边界问题和错误处理,确保程序的稳定性和可靠性。

以上就是NodeJS Streams:在 Pipeline 中优雅地提前结束读取流的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1511954.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月20日 06:53:47
下一篇 2025年12月20日 06:53:53

相关推荐

  • js 怎样实现轮播图

    实现轮播图的核心是控制图片的显示与隐藏及动画流畅性,1. 通过html构建图片容器和控制按钮,2. 使用css的flex布局和transform配合transition实现图片滑动效果,3. 利用javascript控制图片索引(counter)并绑定前后切换逻辑,4. 添加自动轮播功能并通过mou…

    2025年12月20日 好文分享
    000
  • setTimeout和setImmediate在事件循环中的执行顺序是怎样的?

    1.settimeout和setimmediate的执行顺序取决于事件循环阶段。在主模块代码中,settimeout(fn, 0)通常先执行,因为事件循环从timers阶段开始,随后进入check阶段执行setimmediate;但在i/o回调中,setimmediate几乎总是优先,因为事件循环在…

    2025年12月20日 好文分享
    000
  • 如何避免 React Native FlatList 的重复渲染

    在 React Native 开发中,FlatList 是一个常用的组件,用于高效地渲染大型列表数据。然而,不当的使用方式可能会导致不必要的重复渲染,进而影响应用性能。其中一个常见的原因是在 useEffect 钩子中设置了不正确的依赖项,导致 API 请求陷入无限循环。 理解问题的根源 问题的核心…

    2025年12月20日
    000
  • React应用中Axios异步数据顺序渲染问题解析与优化

    本文旨在解决React应用中因Axios异步请求和状态更新机制不当导致的UI元素渲染顺序错乱问题。通过深入分析错误的异步处理模式,如在循环中进行非同步状态更新,并提出使用async/await语法结合Promise.all进行批量数据获取和一次性状态更新的优化方案。此方法能确保数据按预期顺序加载并渲…

    2025年12月20日
    000
  • React应用中处理并发数据请求:避免状态乱序与优化渲染性能

    本教程探讨React应用中因并发数据请求导致UI元素乱序渲染的问题。通过分析错误的异步状态更新模式,本文将详细阐述如何利用Promise.all和async/await协调多个API调用,确保数据按预期顺序加载并一次性更新组件状态,从而实现稳定且高效的UI渲染。 理解并发数据请求的陷阱 在react…

    2025年12月20日
    000
  • WebGPU Rust与JavaScript通信:实现交互式渲染的规范方法

    本文探讨了WebGPU与Rust WebAssembly集成时,如何实现JavaScript与Rust之间的数据通信,以支持交互式渲染。针对#[wasm_bindgen(start)]无法接收参数的限制,文章提出了一种规范且推荐的解决方案:将主入口函数定义为普通的#[wasm_bindgen]导出函…

    2025年12月20日
    000
  • React Native Stack Navigator:统一设置所有屏幕的样式

    本文旨在介绍如何在 React Native 中使用 react-navigation 库的 Stack.Navigator 组件时,统一设置所有屏幕的头部样式。通过使用 screenOptions 属性,可以避免在每个 Stack.Screen 组件中重复定义相同的样式,从而提高代码的可维护性和简…

    2025年12月20日
    000
  • React Navigation StackScreen:统一设置所有屏幕的样式

    本文旨在解决React Native中使用React Navigation库时,如何为StackNavigator中的所有StackScreen统一设置样式的问题。通过screenOptions属性,可以轻松地为StackNavigator下的所有屏幕设置默认的header样式,避免在每个Stack…

    2025年12月20日
    000
  • 使用 window 对象上的外部库的最佳实践

    本文探讨了在 JavaScript 代码中依赖于全局 window 对象上的外部库时,如何处理类型定义和确保库加载完成的最佳实践。通过声明全局接口扩展 window 对象,可以解决编译问题和方便测试中的模拟。同时,使用动态脚本加载和 onload 事件监听,可以确保在库加载完成后再执行依赖代码,避免…

    2025年12月20日
    000
  • 使用 p5.js 预加载 JSON 数据中的图片

    本文旨在解决 p5.js 中预加载 JSON 数据,并根据 JSON 数据中的文件名列表加载图片资源的问题。由于 loadJSON() 和 loadImage() 都是异步函数,直接使用会导致图片未加载完成就开始执行后续代码。本文将介绍如何利用 loadJSON() 的回调函数确保在所有图片加载完成…

    2025年12月20日
    000
  • 基于HTML、JavaScript与Bootstrap的销售数据统计与展示教程

    本教程旨在指导读者如何使用HTML、JavaScript和Bootstrap构建一个交互式网页,用于输入并分析汽车经销商的季度销售数据。文章详细讲解了如何通过JavaScript收集表单数据,并计算每季度总销售额、每位销售代表的最高单季度销售额,以及每位销售代表的平均销售额,最终将结果动态展示在Bo…

    2025年12月20日
    000
  • javascript如何创建指定长度的数组

    创建指定长度的javascript数组有多种方法,1. 使用new array(length)会创建稀疏数组,元素为空槽位,无法被foreach、map等方法遍历;2. 使用array.from({ length: n })可创建填充undefined的数组,且支持映射函数,适合需要初始化值的场景;…

    2025年12月20日 好文分享
    000
  • js如何操作摄像头

    javascript操作摄像头主要通过navigator.mediadevices.getusermedia() api实现,需在https安全上下文中运行;2. 核心步骤包括请求媒体流、处理用户权限、将流绑定到video元素并及时停止释放资源;3. 常见问题有权限拒绝(notallowederro…

    2025年12月20日 好文分享
    000
  • js如何获取cookie的值

    要获取特定cookie值,需通过解析document.cookie字符串实现,具体步骤为:1. 使用document.cookie获取所有cookie组成的字符串;2. 按分号和空格分割成数组;3. 遍历数组并去除每项开头空格;4. 通过encodeuricomponent(name)+&#8221…

    2025年12月20日
    000
  • JavaScript用户输入验证:确保数据有效与非空

    本文旨在探讨JavaScript中如何对用户通过prompt函数输入的字符串进行有效性验证,确保输入非空且符合预期的数据类型(如数字)。通过结合while循环、类型转换以及isNaN()等方法,我们将构建健壮的输入处理逻辑,提升程序的稳定性和用户体验,避免因无效输入导致的运行时错误。 在web应用开…

    2025年12月20日
    000
  • React Native Stack Navigator:统一设置屏幕样式

    在 React Native 的 Stack Navigator 中,我们经常需要在多个屏幕上应用相同的头部样式,例如背景颜色、标题颜色、字体大小和对齐方式。为了避免在每个 Stack.Screen 组件中重复编写相同的样式代码,我们可以利用 screenOptions 属性来统一设置屏幕的默认选项…

    2025年12月20日
    000
  • 统一React Native StackScreen样式的最佳实践

    本文旨在介绍如何在React Native中使用react-navigation库时,统一Stack.Screen的样式,避免在每个屏幕上重复设置相同的headerStyle、headerTitleStyle等选项。通过使用screenOptions属性,可以轻松地为整个StackNavigator…

    2025年12月20日
    000
  • HTML5视频在移动端无法播放?WebM格式兼容性优化指南

    本文旨在解决HTML5视频在移动设备上无法自动播放的常见问题,即使已设置autoplay、playsInline和muted属性。通过深入探讨移动浏览器对视频格式和播放策略的限制,我们发现采用WebM视频格式是提高跨浏览器兼容性,尤其是在Safari、Firefox和Chrome等移动端浏览器上实现…

    2025年12月20日
    000
  • js怎么判断元素是否有某个class

    最直接推荐的方法是使用element.classlist.contains(‘class-name’),它返回布尔值,语义清晰且避免字符串操作陷阱;2. 其他方法包括通过classname属性结合indexof、split().includes()或正则判断,但易受空格、大小…

    2025年12月20日
    000
  • 如何利用事件循环实现高效的错误恢复?

    事件循环中避免错误导致崩溃的关键是将错误“事件化”并分层处理,1. 在局部异步任务中使用 try…catch 或 .catch() 显式处理错误,确保错误不会直接抛出到全局;2. 将异步错误通过 reject 或回调函数传递,避免阻塞事件循环;3. 设置全局兜底机制,监听 uncaugh…

    2025年12月20日 好文分享
    000

发表回复

登录后才能评论
关注微信