Node.js中request包拉取HTML文本编码异常如何解决？

程序猿 • 2025年12月20日 00:33:04 • 用户投稿 • 阅读 0

Node.js 使用request包获取HTML文本编码异常问题及解决方法

在使用Node.js的request包获取网页内容时，经常会遇到编码异常问题，导致输出结果为乱码。本文将分析此问题并提供解决方案。

问题现象

例如，使用以下代码获取网页：

立即学习“前端免费学习笔记（深入）”；

const request = require('request');function getHTML() {    request('https://www.58moto.com/used-car/1470264', (err, res, body) => {        console.log(body);    });}getHTML();

浏览器显示的网页内容为UTF-8编码，但request包输出的结果却是乱码，例如：�z 这是因为request包默认的编码方式与网页实际编码方式不一致导致的。

问题分析

此问题通常是因为request包默认使用系统默认编码（例如windows-1252）进行解码，而目标网页使用的是UTF-8编码。两种编码方式不同，导致解码错误，输出乱码。

解决方案

推荐使用iconv-lite包来解决编码问题。 iconv-lite是一个轻量级的字符编码转换库，可以将不同编码的文本进行转换。修改代码如下：

const request = require('request');const iconv = require('iconv-lite');function getHTML() {    request({        url: 'https://www.58moto.com/used-car/1470264',        encoding: null // 关键：设置encoding为null，防止request自动解码    }, (err, res, body) => {        let decodedBody = iconv.decode(body, 'utf-8'); // 使用iconv-lite解码为utf-8        console.log(decodedBody);    });}getHTML();

这段代码中，encoding: null 阻止了request自动解码，并将原始二进制数据传递给iconv.decode函数。iconv.decode(body, 'utf-8') 将二进制数据解码为UTF-8编码的字符串。请确保已安装iconv-lite包：npm install iconv-lite

另一种更简洁的方案是直接使用axios包替代request。axios默认使用UTF-8解码，无需额外处理编码问题。

选择以上任一方案都可以有效解决request包解码HTML文本编码异常的问题。选择axios方案可以简化代码，提高开发效率。

以上就是Node.js中request包拉取HTML文本编码异常如何解决？的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1502255.html

windows 解决方法

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Node.js爬虫编码异常：如何解决Request模块获取HTML文本乱码问题？

上一篇 2025年12月20日 00:32:56

React中列表事件处理：直接绑定在li元素上比在ul元素上事件代理更好吗？

下一篇 2025年12月20日 00:33:09

用户投稿

怎么在PHP代码中实现图片上传功能_PHP图片上传功能实现与安全处理教程

首先创建含enctype的HTML表单，再用PHP接收文件，检查目录、移动临时文件，验证类型与大小，生成唯一文件名，并调整php.ini限制以确保上传成功。如果您尝试在PHP项目中添加图片上传功能，但服务器无法正确接收或保存文件，则可能是由于表单配置、文件处理逻辑或安全限制的问题。以下是实现该功能…

程序猿
2026年5月10日
1000
用户投稿

网站标题关键词更新后，搜索引擎为何仍显示旧标题？

网站标题更新后，搜索引擎为何显示旧标题？网站SEO优化中，站长常修改网站标题关键词，期望搜索结果显示自定义标题。然而，即使更新标签、meta keywords、meta description和结构化数据中的name属性后，搜索结果仍显示旧标题，这令人费解。本文将对此进行解释。问题：站长修改了网…

程序猿
2026年5月10日
1000
用户投稿

JavaScript 闭包：理解闭包原理与内存泄漏问题

闭包是函数访问其外部作用域变量的能力，即使外部函数已执行完毕。如 inner 函数引用 outer 中的 count，形成闭包，使变量持久存在。闭包本身无害，但可能因延长变量生命周期导致内存泄漏，例如事件监听器引用大对象时。若未及时清理 DOM 事件或定时器，闭包会阻止垃圾回收，造成内存占用过高。解…

程序猿
2026年5月10日
0000
用户投稿

c++如何实现UDP通信_c++基于UDP的网络通信示例

UDP通信基于套接字实现，适用于实时性要求高的场景。1. 流程包括创建套接字、绑定地址（接收方）、发送（sendto）与接收（recvfrom）数据、关闭套接字；2. 服务端监听指定端口，接收客户端消息并回传；3. 客户端发送消息至服务端并接收响应；4. 跨平台需处理Winsock初始化与库链接，编…

程序猿
2026年5月10日
0000
谷歌浏览器如何截图谷歌浏览器页面截图技巧

使用谷歌浏览器的开发者工具截图步骤：1. 按ctrl+shift+i（windows/linux）或cmd+option+i（mac）打开开发者工具。2. 点击右上角三个点，选择”更多工具”，再选择”截图”。3. 选择截取整个页面。推荐的谷歌浏览器扩展…

程序猿
2026年5月10日 • 用户投稿
1000
用户投稿

JavaScript函数中插入加载动画（Spinner）的正确方法

本文旨在解决在JavaScript函数中插入加载动画（Spinner）时遇到的异步问题。通过引入async/await和Promise.all，确保在数据处理完成前后正确显示和隐藏加载动画，提升用户体验。我们将提供两种实现方案，并详细解释其原理和优势。在Web开发中，当执行耗时操作时，显示加载动画…

程序猿
2026年5月10日
0000
用户投稿

pycharm解析器怎么添加解析器添加详细流程

在pycharm中添加解析器的步骤包括：1) 打开pycharm并进入设置，2) 选择project interpreter，3) 点击齿轮图标并选择add，4) 选择解析器类型并配置路径，5) 点击ok完成添加。添加解析器后，选择合适的类型和版本，配置环境变量，并利用解析器的功能提高开发效率。在…

程序猿
2026年5月10日
0000
HTML文档如何工作？如何编辑HTML格式文件？

浏览器解析和渲染html的过程包括：1. 解析html构建dom树；2. 结合css构建渲染树；3. 布局计算元素位置；4. 绘制像素到屏幕。编辑html可使用记事本、vs code、sublime text等文本或代码编辑器，其中vs code因语法高亮、自动补全和插件生态成为主流选择。标准htm…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

硬盘数据被误删除怎么办？教你快速找回删除的文件！

硬盘数据被误删除，别慌！恢复数据并非不可能，关键在于你接下来的操作。立刻停止对该硬盘的任何写入操作，然后尝试使用专业的数据恢复软件。解决方案首先，数据恢复的原理是，删除文件后，操作系统只是将文件占用的空间标记为“可覆盖”，但文件本身的数据可能还存在于硬盘上。所以，避免新的数据写入覆盖掉旧数据，是…

程序猿
2026年5月10日
0000
用户投稿

CodeIgniter在IIS环境下实现URL重写与index.php移除指南

本教程详细指导如何在IIS服务器上部署的CodeIgniter应用中，移除URL中不必要的index.php。核心解决方案涉及修改CodeIgniter的config.php文件，将$config[‘index_page’]设置为空，并辅以正确的IIS web.config重…

程序猿
2026年5月10日
1000
用户投稿

Windows任务管理器查看HTML占用内存情况方法

通过任务管理器可定位HTML页面内存占用过高的问题。首先使用Ctrl+Shift+Esc打开任务管理器，查看chrome.exe或msedge.exe各进程的内存使用情况；再通过Shift+Esc调用浏览器内置任务管理器，精准识别具体标签页的内存消耗；最后可用perfmon性能监视器长期监控浏览器进…

程序猿
2026年5月10日
0000
用户投稿

Go语言连接外部MySQL数据库：DSN配置与常见错误解析

本文详细阐述了go语言使用`go-sql-driver/mysql`驱动连接外部mysql数据库的正确方法。重点介绍了数据源名称（dsn）的规范格式，特别是主机地址部分的配置，以避免常见的“getaddrinfow: the specified class was not found.”等网络解析错…

程序猿
2026年5月10日
0000
用户投稿

c++中sizeof运算符的用法和常见陷阱 _c++ sizeof使用技巧及陷阱解析

sizeof运算符在编译时计算类型或对象的字节大小，返回size_t类型，常用于获取数据大小、数组元素个数及内存操作；但存在数组传参退化为指针导致失效、对指针无法获知动态内存大小、表达式不求值、结构体因对齐产生填充等常见陷阱；需结合模板、显式传参、对齐控制等方式规避问题，提升代码可移植性和安全性。 …

程序猿
2026年5月10日
0000
用户投稿

win10安装软件时出现内部错误2503怎么办_win10软件安装内部错误修复方案

1、通过管理员权限运行命令提示符执行msiexec命令可解决安装权限问题；2、修改C:WindowsTemp文件夹的用户权限为完全控制以消除错误2503；3、重启explorer.exe进程释放系统资源；4、获取Windows Installer文件夹所有权并重置权限确保安装服务正常运行。如果您在…

程序猿
2026年5月10日
0000
用户投稿

Highcharts加载大量散点图失败，如何解决？

highcharts 加载大批量散点图界面加载失败的原因： highcharts 库有一个性能阈值（turbothreshold），用于确定何时使用优化技术来提高图表性能。对于大量数据，默认阈值为 1000。当数据量超过阈值时，highcharts 将切换到不同的渲染模式，该模式可能无法正确加载散点…

程序猿
2026年5月10日
0000
用户投稿

后缀php怎么打开_php文件打开方式与运行环境搭建指南

要打开PHP文件需根据用途选择方式：查看代码可用文本编辑器或IDE，运行则需服务器环境。推荐新手使用XAMPP、WAMP等集成环境，将文件放入htdocs目录后访问localhost；开发者可利用PHP内置服务器，命令行执行php -S localhost:8000运行；高级用户可手动配置Apach…

程序猿
2026年5月10日
0000
用户投稿

解决Python脚本中相对路径文件找不到的常见问题与策略

本文旨在解决python脚本中因相对路径处理不当导致的文件找不到错误，尤其是在项目迁移后。文章将深入探讨python中相对路径的工作原理、当前工作目录（cwd）的影响，并提供使用`os.getcwd()`诊断问题以及利用`os.path.dirname(__file__)`结合`os.path.jo…

程序猿
2026年5月10日
0000
用户投稿

C++内存检测工具 Valgrind使用实践指南

Valgrind是一款主要用于Linux和macOS的内存调试工具，可检测内存泄漏、越界访问、未初始化内存使用等问题，通过memcheck工具结合–leak-check=full、–track-origins=yes等选项进行详细分析，需编译时添加-g选项以支持调试信息，虽然…

程序猿
2026年5月10日
0000
用户投稿

Windows用Prettier一键格式化乱码HTML代码

首先确保HTML文件保存为UTF-8编码，使用文本编辑器另存为UTF-8格式；其次在命令行执行chcp 65001切换至UTF-8代码页后再运行Prettier；接着在VS Code中设置files.encoding为utf8并启用files.autoGuessEncoding；最后可通过Node.…

程序猿
2026年5月10日
0000
用户投稿

Python多线程中GIL的影响 Python多线程绕过GIL限制的方法

Python多线程因GIL无法并行执行CPU密集型任务，GIL使同一时刻仅一个线程运行字节码，限制多核利用；但I/O密集型任务中GIL会被释放，多线程仍有效。解决方法包括：1. 使用multiprocessing模块通过多进程绕过GIL，实现真正并行；2. 调用C扩展或Cython在计算时释放GIL…

程序猿
2026年5月10日
0000

发表回复

登录后才能评论

Node.js中request包拉取HTML文本编码异常如何解决？

关于作者

相关推荐

发表回复