深入浅析Node中的Stream（流）

程序猿 • 2025年11月9日 16:35:52 • 用户投稿 • 阅读 2

什么是流？如何理解流？下面本篇文章就来带大家深入了解一下nodejs中的流（stream），希望对大家有所帮助！

stream 是一个抽象的数据接口，它继承了 EventEmitter，它能够发送/接受数据，本质就是让数据流动起来，如下图：

流不是 Node 中独有的概念，是操作系统最基本的操作方式，在 Linux 中 | 就是 Stream，只是 Node 层面对其做了封装，提供了对应的 API

为啥要一点一点？

首先使用下面的代码创建一个文件，大概在 400MB 左右【相关教程推荐：nodejs视频教程】

当我们使用 readFile 去读取的时候，如下代码

正常启动服务时，占用 10MB 左右的内存

使用curl http://127.0.0.1:8000发起请求时，内存变为了 420MB 左右，和我们创建的文件大小差不多

改为使用使用 stream 的写法，代码如下

再次发起请求时，发现内存只占用了 35MB 左右，相比 readFile 大幅减少

如果我们不采用流的模式，等待大文件加载完成在操作，会有如下的问题：

内存暂用过多，导致系统崩溃CPU 运算速度有限制，且服务于多个程序，大文件加载过大且时间久

总结来说就是，一次性读取大文件，内存和网络都吃不消

如何才能一点一点？

我们读取文件的时候，可以采用读取完成之后在输出数据

上述说到 stream 继承了 EventEmitter 可以是实现监听数据。首先将读取数据改为流式读取，使用 on("data", ()⇒{}) 接收数据，最后通过 on("end", ()⇒{}) 最后的结果

有数据传递过来的时候就会触发 data 事件，接收这段数据做处理，最后等待所有的数据全部传递完成之后触发 end 事件。

数据的流转过程

数据从哪里来—source

数据是从一个地方流向另一个地方，先看看数据的来源。

http 请求，请求接口来的数据

console 控制台，标准输入 stdin

file 文件，读取文件内容，例如上面的例子

连接的管道—pipe

在 source 和 dest 中有一个连接的管道 pipe，基本语法为 source.pipe(dest) ，source 和 dest 通过 pipe 连接，让数据从 source 流向 dest

我们不需要向上面的代码那样手动监听 data/end 事件.

pipe 使用时有严格的要求，source 必须是一个可读流，dest 必须是一个可写流

??? 流动的数据到底是一个什么东西？代码中的 chunk 是什么？

到哪里去—dest

stream 常见的三种输出方式

console 控制台，标准输出 stdout

http 请求，接口请求中的 response

file 文件，写入文件

流的种类

可读流 Readable Streams

可读流是对提供数据的源头(source)的抽象

所有的 Readable 都实现了 stream.Readable 类定义的接口

? 读取文件流创建

fs.createReadStream 创建一个 Readable 对象

读取模式

可读流有两种模式，流动模式(flowing mode)和暂停模式(pause mode)，这个决定了 chunk 数据的流动方式：自动流动和手工流动

在 ReadableStream 中有一个 _readableState 属性，在其中有一个 flowing 的一个属性来判断流的模式，他有三种状态值：

ture：表示为流动模式false：表示为暂停模式null：初始状态

可以使用热水器模型来模拟数据的流动。热水器水箱(buffer 缓存区)存储着热水(需要的数据)，当我们打开水龙头的时候，热水就会从水箱中不断流出来，并且自来水也会不断的流入水箱，这就是流动模式。当我们关闭水龙头时，水箱会暂停进水，水龙头则会暂停出水，这就是暂停模式。

流动模式

数据自动地从底层读取，形成流动现象，并通过事件提供给应用程序。

监听 data 事件即可进入该模式
当 data 事件被添加后，可写流中有数据后会将数据推到该事件回调函数中，需要自己去消费数据块，如果不处理则该数据会丢失

调用 stream.pipe 方法将数据发送到 Writeable

调用 stream.resume 方法

暂停模式

数据会堆积在内部缓冲器中，必须显式调用 stream.read() 读取数据块

监听 readable 事件可写流在数据准备好后会触发该事件回调，此时需要在回调函数中使用 stream.read() 来主动消费数据。readable 事件表明流有新的动态：要么有新的数据，要么流已经读取所有数据

百度文心百中

百度大模型语义搜索体验中心

22 查看详情

两种模式之间如何进行转换呢

可读流在创建完成之后处于初始状态 //TODO：和网上的分享不一致

暂停模式切换到流动模式

- 监听 data 事件- 调用 stream.resume 方法- 调用 stream.pipe 方法将数据发送到 Writable

流动模式切换到暂停模式

- 移除 data 事件- 调用 stream.pause 方法- 调用 stream.unpipe 移除管道目标

实现原理

创建可读流的时候，需要继承 Readable 对象，并且实现 _read 方法

创建一个自定义可读流

当我们调用 read 方法时，整体的流程如下：

doRead

流中维护了一个缓存，当调用 read 方法的时候来判断是否需要向底层请求数据

当缓存区长度为0或者小于 highWaterMark 这个值得时候就会调用 _read 去底层获取数据源码链接

可写流 Writeable Stream

可写流是对数据写入目的地的一种抽象，是用来消费上游流过来的数据，通过可写流把数据写入设备，常见的写入流就是本地磁盘的写入

可写流的特点

通过 write 写入数据

通过 end 写数据并且关闭流，end = write + close

当写入数据达到 highWaterMark 的大小时，会触发 drain 事件

调用 ws.write(chunk) 返回 false，表示当前缓冲区数据大于或等于 highWaterMark 的值，就会触发 drain 事件。其实是起到一个警示作用，我们依旧可以写入数据，只是未处理的数据会一直积压在可写流的内部缓冲区中，直到积压沾满 Node.js 缓冲区后，才会被强行中断

自定义可写流

所有的 Writeable 都实现了 stream.Writeable 类定义的接口

只需要实现 _write 方法就能够将数据写入底层

通过调用调用 writable.write 方法将数据写入流中，会调用 _write 方法将数据写入底层当 _write 数据成功后，需要调用 next 方法去处理下一个数据必须调用 writable.end(data) 来结束可写流，data 是可选的。此后，不能再调用 write 新增数据，否则会报错在 end 方法调用后，当所有底层的写操作均完成时，会触发 finish 事件

双工流 Duplex Stream

双工流，既可读，也可写。实际上继承了 Readable 和 Writable 的一种流，那它既可以当做可读流来用又可以当做可写流来用

自定义的双工流需要实现 Readable 的 _read 方法和 Writable 的 _write 方法

net 模块可以用来创建 socket，socket 在 NodeJS 中是一个典型的 Duplex，看一个 TCP 客户端的例子

client 就是一个 Duplex，可写流用于向服务器发送消息，可读流用于接受服务器消息，两个流内的数据并没有直接的关系

转换流 Transform Stream

上述的例子中，可读流中的数据(0/1)和可写流中的数据(’F’,’B’,’B’)是隔离的，两者并没有产生关系，但对于 Transform 来说在可写端写入的数据经过变换后会自动添加到可读端。

Transform 继承于 Duplex，并且已经实现了 _write 和 _read 方法，只需要实现 _tranform 方法即可

gulp 基于 Stream 的自动化构建工具，看一段官网的示例代码

less → less 转为 css → 执行 css 压缩 → 压缩后的 css

其实 less() 和 minifyCss() 都是对输入的数据做了一些处理，然后交给了输出数据

Duplex 和 Transform 的选择

和上面的示例对比起来，我们发现一个流同时面向生产者和消费者服务的时候我们会选择 Duplex，当只是对数据做一些转换工作的时候我们便会选择使用 Tranform

背压问题

什么是背压

背压问题来源于生产者消费者模式中，消费者处理速度过慢

比如说，我们下载过程，处理速度为3Mb/s，而压缩过程，处理速度为1Mb/s，这样的话，很快缓冲区队列就会形成堆积

要么导致整个过程内存消耗增加，要么导致整个缓冲区慢，部分数据丢失

什么是背压处理

背压处理可以理解为一个向上”喊话”的过程

当压缩处理发现自己的缓冲区数据挤压超过阈值的时候，就对下载处理“喊话”，我忙不过来了，不要再发了

下载处理收到消息就暂停向下发送数据

如何处理背压

我们有不同的函数将数据从一个进程传入另外一个进程。在 Node.js 中，有一个内置函数称为 .pipe()，同样地最终，在这个进程的基本层面上我们有二个互不相关的组件：数据的_源头_，和_消费者_

当 .pipe() 被源调用之后，它通知消费者有数据需要传输。管道函数为事件触发建立了合适的积压封装

在数据缓存超出了 highWaterMark 或者写入的列队处于繁忙状态，.write() 会返回 false

当 false 返回之后，积压系统介入了。它将暂停从任何发送数据的数据流中进入的 Readable。一旦数据流清空了，drain 事件将被触发，消耗进来的数据流

一旦队列全部处理完毕，积压机制将允许数据再次发送。在使用中的内存空间将自我释放，同时准备接收下一次的批量数据

我们可以看到 pipe 的背压处理：

将数据按照chunk进行划分，写入当chunk过大，或者队列忙碌时，暂停读取当队列为空时，继续读取数据

更多node相关知识，请访问：nodejs 教程！

以上就是深入浅析Node中的Stream（流）的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/543985.html

node.js 前端

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

戴尔n4050驱动下载安装以及相关问题解答

上一篇 2025年11月9日 16:35:51

PHP框架如何通过社区支持和教程促进知识共享和技能提升，从而提高效率？

下一篇 2025年11月9日 16:35:59

用户投稿

修复Django电商项目中AJAX过滤产品列表图片不显示问题

在Django电商项目中，当使用AJAX动态加载过滤后的产品列表时，常遇到图片无法正常显示的问题。这通常是由于前端模板中图片加载方式（如data-setbg属性结合JavaScript库）与AJAX动态内容更新机制不兼容所致。解决方案是直接在AJAX返回的HTML中使用标准的标签来渲染图片，确保浏览…

程序猿
2026年5月10日
0000
用户投稿

开源免费PHP工具 PHP开发效率提升利器

推荐开源免费PHP开发工具以提升效率：VS Code、Sublime Text轻量高效，PhpStorm专业强大；调试用Xdebug、Kint、Ray；依赖管理选Composer；代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer；数据库管理可用%ignore_a_1%MyA…

程序猿
2026年5月10日
0000
用户投稿

前端缓存策略与JavaScript存储管理

根据数据特性选择合适的存储方式并制定清晰的读写与清理逻辑，能显著提升前端性能；合理运用Cookie、localStorage、sessionStorage、IndexedDB及Cache API，结合缓存策略与定期清理机制，可在保证用户体验的同时避免安全与性能隐患。前端缓存和JavaScript存…

程序猿
2026年5月10日
1000
用户投稿

JavaScript 高效判断页面所有复选框状态的技巧与实践

本文旨在提供一套高效且专业的javascript方法，用于判断网页中所有复选框的选中状态。我们将探讨如何利用`array.some()`快速确定是否有未选中的复选框（进而判断是否全部选中），以及如何使用`array.filter()`统计选中和未选中的复选框数量。通过优化dom元素选择和数组操作，提…

程序猿
2026年5月10日
0000
用户投稿

从 JavaScript 获取 URL 并在 PHP DataGrid 中使用

本文档旨在指导开发者如何从 JavaScript 函数中获取 URL，并将其动态应用于 PHP DataGrid。通过前端 JavaScript 动态生成 API 地址，并将其传递给后端的 PHP DataGrid，实现数据根据用户会话动态加载。动态配置 DataGrid 的 URL 在构建动态 …

程序猿
2026年5月10日
0000
用户投稿

控制HTML Canvas颜色空间输出24位深度TIFF图像

本教程详细介绍了如何在web前端环境中，特别是结合`html2canvas`和`canvas-to-tiff`库时，通过明确设置html canvas的颜色空间为`srgb`，从而确保输出24位深度的tiff图像。文章将提供具体的javascript代码示例，并解释其原理，帮助开发者解决canvas…

程序猿
2026年5月10日
1000
用户投稿

HTML中如何实现MathML

答案是利用HTML5原生支持MathML，只需将MathML代码嵌入标签即可，现代浏览器能直接渲染，无需插件；通过CSS可美化公式样式，如字体、颜色、间距等，提升显示效果；对于老旧浏览器，推荐使用MathJax作为兼容方案，支持LaTeX输入并渲染为高质量公式，兼顾可访问性与跨浏览器兼容性。在HT…

程序猿
2026年5月10日
0000
用户投稿

JavaScript Electron桌面应用

答案：使用JavaScript开发%ignore_a_1%桌面应用需结合Web技术与Node.js，通过主进程管理窗口、渲染进程展示界面，并利用IPC通信，调用系统功能如文件对话框，最后用electron-builder打包发布，注意安全与进程职责分离。用JavaScript开发Electron桌…

程序猿
2026年5月10日
0000
用户投稿

如何通过浏览器扩展实现快速HTML代码编辑的处理方法

答案：通过浏览器扩展可实现快速HTML编辑，提升开发效率。首先选择如EditThisPage、Live HTML Editor、Web Developer或Scratchpad for Chrome等工具，安装后启用扩展的页面内编辑功能，直接修改DOM并实时预览；修改仅限当前会话，刷新即失效，适合临…

程序猿
2026年5月10日
0000
用户投稿

PHP代码注入检测日志分析_PHP代码注入日志检测方法详解

答案：日志分析是发现PHP代码注入的关键手段，主要通过Web服务器访问日志、PHP错误日志、PHP-FPM日志及应用自定义日志等多源数据，结合grep、ELK、WAF等工具识别含eval()、system()、Base64编码、目录遍历等特征的异常请求，并建立基线、设置检测规则与自动化告警，配合事件…

程序猿
2026年5月10日
0000
用户投稿

JavaScript中为动态列表元素创建唯一悬停描述的教程

本教程旨在解决如何为动态生成的列表或数组元素分配唯一悬停描述（tooltip）的问题。文章将深入探讨使用javascript对象和map数据结构来高效地管理名称与描述的映射关系，并提供具体的代码示例，以实现每个列表项在鼠标悬停时显示不同的自定义信息，同时兼顾性能与数据顺序的需求。在网页开发中，我们…

程序猿
2026年5月10日
0000
用户投稿

Go语言与Microsoft SharePoint集成指南

Go语言可以有效集成Microsoft SharePoint，主要通过两种途径：一是利用SharePoint提供的RESTful API进行数据交互，Go的标准HTTP客户端库即可轻松实现；二是通过SharePoint应用模型开发自托管应用，这种模型支持使用包括Go在内的任何语言编写后端逻辑。 1.…

程序猿
2026年5月10日
0000
用户投稿

javascript生命周期钩子是什么_组件有哪些关键阶段？

JavaScript原生无生命周期钩子，这是Vue、React等框架为组件设计的机制；Vue按创建、挂载、更新、卸载四阶段提供对应钩子，React类组件有明确生命周期方法，函数组件则通过useEffect模拟，其核心价值在于精准控制执行时机以避免DOM操作错误和内存泄漏。 JavaScript 本身…

程序猿
2026年5月10日
0000
用户投稿

如何安全有效地从外部网页获取HTML元素数据并应用于自身页面

本教程旨在解决如何在不同域名下，通过javascript获取并使用另一个网页的html元素数据。文章将深入探讨同源策略的限制，并提供两种主要解决方案：使用` 在现代Web开发中，有时我们需要从外部网站获取特定的HTML内容或属性值，并将其整合到我们自己的网页中。例如，从XYZ.COM/B.html页…

程序猿
2026年5月10日
0000
用户投稿

怎么安装html5_HTML5开发环境安装与配置详细步骤

答案是配置HTML5开发环境需三步：1. 安装VS Code等编辑器并配置插件；2. 使用Chrome或Firefox测试页面；3. 可选搭建本地服务器，如Live Server或http-server；最后创建index.html文件验证环境。安装HTML5开发环境其实并不复杂，因为HTML5本…

程序猿
2026年5月10日
0000
用户投稿

JavaScript动态下拉菜单：实现日期选项与价格计算关联

在现代web应用中，动态生成表单元素并使其具备交互逻辑是常见的需求。特别是在需要根据用户选择调整价格或服务参数的场景下，下拉菜单（）常被用来展示一系列选项。本教程将指导您如何利用javascript动态生成一个包含日期选项的下拉菜单，并为每个选项关联一个具体的数值（如剩余天数），进而实现一个基于用户…

程序猿
2026年5月10日
0000
从视频链接中提取视频时长的前端实现教程

本文详细介绍了如何在%ignore_a_1%通过javascript从html “ 元素中提取视频时长。核心方法是利用视频元素的 `loadeddata` 事件，确保视频元数据加载完成后，再访问其 `duration` 属性。教程将提供完整的html和javascript代码示例，并讨论相关注意事…

程序猿
2026年5月10日 • 用户投稿
1000
用户投稿

使用SMTP.js发送邮件：客户端集成、常见问题与最佳实践指南

本文深入探讨了使用SMTP.js库在前端发送邮件时可能遇到的问题，特别是与Elastic Email集成时的挑战。我们将分析代码中常见的异步处理错误、条件函数定义陷阱，并提供修正后的代码示例和最佳实践。重点强调了正确处理Promise链、确保函数可访问性以及客户端邮件发送的安全考量，帮助开发者构建更…

程序猿
2026年5月10日
0000
用户投稿

如何在不暴露密钥的情况下，在客户端创建 Stripe Payment Link

本文介绍了在纯静态网站环境下，如何利用 Stripe Payment Link 实现商品售卖，并着重讨论了在不暴露 Stripe 密钥的前提下，客户端创建 Payment Link 的可行性。分析了直接在客户端使用密钥的风险，并提出了预先生成 Payment Link 或使用后端服务动态生成 Pay…

程序猿
2026年5月10日
0000
用户投稿

前端性能监控如何量化JavaScript的加载时间？

通过Performance API可精确量化JavaScript加载时间，首先调用performance.getEntriesByType(‘resource’)获取资源加载记录，筛选出mimeType为application/javascript或URL含.js的条目，提取…

程序猿
2026年5月10日
0000