使用 Cheerio 加载和操作 HTML 片段字符串

程序猿 • 2025年11月30日 14:50:12 • web前端 • 阅读 3

本文将介绍如何使用 Cheerio 库加载和操作 HTML 片段字符串，并避免 Cheerio 默认将其包裹在完整的 HTML 文档结构中。通过配置 cheerio.load() 函数的参数，我们可以直接访问和操作 HTML 片段，从而更方便地进行后续处理。

Cheerio 是一个为服务器特别定制的快速、灵活、简洁的 jQuery 核心实现。它非常适合从 HTML 文档中提取和操作数据。然而，默认情况下，当使用 cheerio.load() 函数加载 HTML 字符串时，Cheerio 会将其包装在一个完整的 HTML 文档结构中，这在某些情况下可能会带来不便。

例如，以下代码：

const cheerio = require('cheerio');const htmlString = ' Skyy
';const $ = cheerio.load(htmlString);console.log($.html());

输出结果为：

立即学习“前端免费学习笔记（深入）”；

 Skyy

可以看到，原始的 HTML 片段被 Cheerio 包装在了 , , <bodyyoujiankuohaophpcn 等标签中。这使得直接访问和操作该片段变得稍微复杂。

为了避免这种情况，可以使用 cheerio.load() 函数的第三个参数，将其设置为 false。该参数用于禁用 HTML 包装。

以下是修改后的代码：

const cheerio = require('cheerio');const htmlString = ' Skyy
';const $ = cheerio.load(htmlString, null, false);console.log($.html());

输出结果为：

立即学习“前端免费学习笔记（深入）”；

 Skyy

现在，输出结果就是原始的 HTML 片段，没有被额外的 HTML 标签包裹。

详细解释：

cheerio.load() 函数的完整签名为：

cheerio.load(html, options, isDocument);

html: 要加载的 HTML 字符串。options: 一个可选的配置对象，用于指定 Cheerio 的行为。可以设置为 null 使用默认选项。isDocument: 一个布尔值，指定是否将 HTML 字符串视为完整的 HTML 文档。将其设置为 false 可以禁用 HTML 包装。

示例：

以下示例展示了如何使用禁用 HTML 包装来提取 HTML 片段中的文本内容：

const cheerio = require('cheerio');const htmlString = ' Skyy
';const $ = cheerio.load(htmlString, null, false);const artistName = $('.artist').text();console.log(artistName); // 输出：Skyy

总结：

通过使用 cheerio.load() 函数的第三个参数并将其设置为 false，可以有效地禁用 Cheerio 的 HTML 包装功能，从而更方便地加载和操作 HTML 片段字符串。这在处理不完整的 HTML 片段或需要直接访问特定节点时非常有用。请记住，第二个参数通常设置为 null 以使用默认选项，而第三个参数控制是否将其作为完整的 HTML 文档加载。

以上就是使用 Cheerio 加载和操作 HTML 片段字符串的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/138513.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

293.6K 文章

0 评论

1 粉丝

这个人很懒，什么都没有留下～

JavaScript教程：在两个元素之间交换属性子集

上一篇 2025年11月30日 14:42:04

JavaScript中高效管理和重分类数组值：构建双向映射数据结构

下一篇 2025年11月30日 15:07:29

好文分享

Authorization 请求头如何正确的设置 Access Token？

github 三方授权登录 access token 使用在进行 github 三方授权登录时，用户需要提供来自 github 的 access token。access token 应该被放置在请求头的 authorization 字段中，正确格式如下： authorization: beare…

程序猿
2025年12月10日
0000
好文分享

如何在 PHP 脚本中导入 config.php 文件？

php 中的 include() 函数将指定文件中的代码复制到使用 include 语句的文件中。它指示预处理器将指定文件的内容插入到当前程序中。要包含的文件名用双引号括起来。最好的做法是在名为“config.php”的文件中写入基本数据库和用户详细信息。您还可以在“config.php”文件中包含…

程序猿
2025年12月10日
0000
好文分享

PHP 函数设计模式的未来发展趋势

函数设计模式在php中不断演变，新模式包括：闭包：允许创建可访问外部变量的函数，提高可读性和可重用性。箭头函数：简化闭包语法，提升可读性。柯里化函数：部分应用函数，减少参数数量，增强可读性和可重用性。偏函数应用：设置函数默认参数，使代码更简洁。实战案例：使用闭包计算阶乘，展示函数设计模式的应用。 P…

程序猿
2025年12月10日
0000
好文分享

PHP 函数设计模式应用与可扩展性

PHP 函数设计模式的应用与可扩展性简介函数设计模式是编写模块化、可重用和可扩展代码的最佳实践。在 PHP 中应用函数设计模式可以提高代码的可维护性和扩展性。经典设计模式 1. 单例模式限制类实例化的数量，确保只能创建一个实例。立即学习“PHP免费学习笔记（深入）”； class Single…

程序猿
2025年12月10日
0000
好文分享

php 函数缓存技术详解：如何监控和维护函数缓存技术？

函数缓存通过在内存中存储编译后的 php 函数提升性能。监控函数缓存至关重要，可使用 opcache_get_status() 函数和 zend opcache 扩展。维护包括定期清除缓存、设置缓存大小和排除不适合缓存的文件。通过 opcache_get_status() 函数，可获取缓存命中率、未…

程序猿
2025年12月10日
0000
好文分享

PHP 正则表达式在爬虫中的神奇应用

php 正则表达式的爬虫应用：提供高效的文本数据匹配和解析能力。使用 preg_match()、preg_match_all() 和 preg_replace() 函数处理正则表达式。正则表达式语法包括特殊字符和元字符，用于匹配特定模式。实际应用示例包括提取电子邮件地址（[a-za-z0-9._%+…

程序猿
2025年12月10日
0000
好文分享

PHP 函数设计模式应用指南

针对不同设计模式，本文提供了 php 中的常见函数设计模式以及它们的应用指南。这些模式包括：factory 模式，builder 模式，singleton 模式，observer 模式和 iterator 模式。通过应用这些模式，开发者可以创建可扩展、易于维护和调试的 php 代码。 PHP 函数设…

程序猿
2025年12月10日
0000
好文分享

php函数对象编程指南的最佳实践是什么？

函数对象编程最佳实践包括：1. 将相关数据和行为分组到类中；2. 使用访问修饰符控制类的访问权限；3. 使用构造函数初始化对象；4. 使用方法链提高代码可读性；5. 考虑使用策略设计模式提高扩展性和灵活性。 PHP 函数对象编程的最佳实践指南函数对象编程 (OOP) 是一种强大而灵活的编程范例，它…

程序猿
2025年12月10日
0000
好文分享

PHP 函数设计模式最佳实践

PHP 函数设计模式最佳实践在编写 PHP 代码时，遵循设计模式可以提高代码的可读性、可维护性和可重用性。本文将介绍一些 PHP 函数设计模式的最佳实践，并通过实战案例加以说明。单一职责原则每个函数应该只负责一项任务。将复杂的逻辑分解成更小的函数可以提高代码的可读性和可维护性。示例： // …

程序猿
2025年12月10日
0000
好文分享

PHP 正则表达式与脚本自动化的强力搭档

php 正则表达式与自动化脚本协作强大，可简化复杂任务和提高生产力。正则表达式使用特殊字符指定模式，如 .*（匹配任何字符）、d（匹配数字）、^（匹配开头）、{}（指定重复）。通过 php 函数如 preg_match_all() 和 preg_match()，可提取电子邮件地址、验证表单输入，并执…

程序猿
2025年12月10日
0000
好文分享

如何使用 PHP 函数设计模式解决常见编程问题？

函数设计模式是 php 中可重用的代码片段，用于解决常见编程问题，包括：单例模式：确保一个类只有一个实例存在。工厂模式：创建不同类型的对象，而无需指定具体类。观察者模式：允许对象订阅和响应事件。策略模式：允许您在运行时更改算法的行为。模板方法模式：定义操作的一般步骤，具体实现由子类定义。如何使用 …

程序猿
2025年12月10日
0000
好文分享

PHP函数缓存的未来发展趋势

PHP 函数缓存的未来发展趋势随着 PHP 应用的规模和复杂性的不断增长，函数缓存已成为提高性能的关键技术。本文将探讨 PHP 函数缓存的未来发展趋势，并提供一个实战案例。趋势 1：对 JIT 编译的支持 JIT（即时编译）是一种编译技术，可以在运行时将 PHP 代码编译成机器代码。这可以显著提…

程序猿
2025年12月10日
0000
好文分享

PHP函数缓存技术在不同应用场景下的选择与应用

php函数缓存技术：缓存函数结果以提高性能，涉及结果缓存和元数据缓存。php内置函数缓存工具：高性能opcache可配置的apc分布式的memcached场景选择：极高性能：opcache更多配置：apc分布式需求：memcached实战案例：结果缓存（opcache）：ini_set(&#8216…

程序猿
2025年12月10日
0000
好文分享

php网络编程指南：安全注意事项和最佳实践

在 php 网络编程中，确保代码安全至关重要。要构建安全的应用程序，必须：使用 https 协议进行加密数据传输；验证用户输入，防止恶意攻击；设置安全标头，保护应用程序免受攻击；避免错误报告，防止信息泄露；限制文件上传大小，防止恶意文件上传；使用验证码阻止自动化攻击，如机器人表单填写。 PHP 网络…

程序猿
2025年12月10日
0000
好文分享

php正则表达式如何处理边界匹配？

php正则表达式boundary matchers可匹配行首字符（^）、行尾字符（$）、单词边界（b）。使用^可匹配以特定单词开头的行（例如，preg_match(“/^this/”, $str)），使用$可匹配以特定单词结尾的行（例如，preg_match(“/…

程序猿
2025年12月10日
0000
好文分享

php函数文件操作指南：如何打开文件？

php中打开文件的方法有三种：fopen()：打开文件并返回文件指针。file()：打开文件并读取全部内容。__construct()：创建一个文件对象并打开文件。 PHP 函数文件操作指南：如何打开文件？简介在 PHP 中，文件操作是非常重要的任务。了解如何打开一个文件至关重要，因为这是对文件…

程序猿
2025年12月10日
0000
好文分享

php 函数缓存技术详解：如何在函数缓存技术中处理缓存无效？

php 函数缓存技术可以通过避免昂贵的函数调用来提高应用性能。然而，当函数或其依赖项发生更改时，缓存的函数可能变得无效。应对缓存无效的策略包括：定时清理缓存使用版本化缓存键监听依赖项的更改使用事件系统妥善处理缓存无效有助于维护可靠且响应迅速的 php 应用。 PHP 函数缓存技术详解：应对缓存无效的…

程序猿
2025年12月10日
0000
好文分享

PHP函数缓存的应用场景与实例

函数缓存是一种用于存储和重用函数调用结果的技术。其应用场景包括数据库查询、昂贵计算、动态页面生成和提升用户体验。php 内置了 apc 内核函数缓存，可通过以下步骤实现函数缓存：1. 检查 apc 是否可用；2. 设置 apc 缓存配置；3. 将昂贵的函数调用存储在缓存中；4. 从缓存中检索结果。 …

程序猿
2025年12月10日
0000
好文分享

PHP 正则表达式精通：理论与实践相结合的指南

php 正则表达式教程提供理论与实践，帮助掌握文本处理。语法包括特殊字符（.、^、$等）和量词（d、s、w等）。实战案例包括验证电子邮件地址、提取 html 文本和替换数字为文本。使用 php 函数如 preg_match() 和 preg_replace() 进行操作，例如验证电子邮件地址、提取 …

程序猿
2025年12月10日
0000
好文分享

PHP 函数事件处理技术如何与其他框架集成？

php 函数事件处理技术允许你在函数和方法上定义事件，并通过与其他框架集成来扩展其功能。通过与 laravel 和 symfony 框架集成，你可以注册和触发事件以执行特定动作。实际应用中，你可以使用它与 swiftmailer 框架集成，在用户创建时通过事件处理程序发送欢迎邮件。 PHP 函数事件…

程序猿
2025年12月10日
0000

发表回复

登录后才能评论

使用 Cheerio 加载和操作 HTML 片段字符串

关于作者

相关推荐

发表回复