如何使用正则表达式提取特定 HTML 结构中的内容？

程序猿 • 2025年12月9日 21:03:51 • 好文分享 • 阅读 0

正则表达式匹配特定 html 结构

通过正则表达式，我们可以解析 html 文本并提取所需数据。以下是一个实例，展示了如何通过正则表达式匹配特定 html 结构并提取其中的内容：

给定以下 html 结构：

我们希望提取 class 为 “block-2” 的 div 中所有 li 标签内的值。

立即学习“前端免费学习笔记（深入）”；

使用以下正则表达式可以实现上述目的：

/(?<=block-1.*).*?(?=.*block-2)/g

该正则表达式包含以下部分：

(?)：匹配以 class 为 “block-1” 的 div 内 li 标签之前的任何内容。.*?：非贪婪匹配 li 标签的内容（包括子元素）。(?=.*block-2)：匹配以 class 为 “block-2” 的 div 内 li 标签之后的任何内容。

利用该正则表达式，我们可以如下提取所需数据：

let str = strhtml; // html 文本let removeenter = str.replace(/[rn]/g, "").replace(/[ ]/g, "").match(/(?<=block-1.*).*?(?=.*block-2)/g);console.log(removeenter);

输出结果：

["文章标题1", "文章标题2", "文章标题3"]

以上就是如何使用正则表达式提取特定 HTML 结构中的内容？的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1249070.html

赞 (0)

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

288.1K 文章

0 评论

1 粉丝

这个人很懒，什么都没有留下～

使用 PHP-Webdriver 如何获取渲染后的页面代码？

上一篇 2025年12月9日 21:03:45

扫码支付中，订单写入数据库的最佳时机是什么？

下一篇 2025年12月9日 21:03:55

Lithe 中的播种者：轻松填充您的数据库

在应用程序开发方面，拥有可用的测试数据至关重要。 lithe 中的播种器提供了一种简单有效的方法来使用初始数据或测试数据填充数据库，使您能够专注于应用程序逻辑。在这篇文章中，我们将探索如何在 lithe 中创建和使用播种器。什么是播种机？ seeders 是负责自动将数据插入数据库的类。当您需要虚…

程序猿
好文分享 2025年12月9日
0000
好文分享

如何去除字符串中包含 HTML 标签的中间部分，只保留文本内容？

字符串中去除 html 标签问题：如何去除字符串中包含 html 标签的中间部分，只保留文本内容？解决方案：立即学习“前端免费学习笔记（深入）”；使用 strip_tags() 函数可以去除字符串中的所有 html 标签。示例： $str = ‘ttttgg。 ‘;$result = s…

程序猿
2025年12月9日
0000
好文分享

如何将 WordPress 评论功能集成到自定义 PHP 页面？

WordPress 评论功能的提取提取 WordPress 评论功能并将其集成到自定义 PHP 页面中是一个常见的开发需求。然而，没有直接的方法可以提取评论系统本身。解决方案：手动实现由于缺乏直接提取机制，您需要自己实现评论功能。以下是一些步骤：立即学习“PHP免费学习笔记（深入）”；创建…

程序猿
2025年12月9日
0000
好文分享

命令行模式下 PHP Redis 为什么会提示 Class Redis not found？

命令行模式下 php redis 无法使用在命令行模式下运行 php 程序时，遇到 class redis not found 的错误。经查询，发现这是因为 php 命令行环境下没有加载 redis 扩展文件 redis.so 导致的。要解决这个问题，需要在命令行环境下加载 redis 扩展文件…

程序猿
2025年12月9日
0000
好文分享

PHP 如何访问本地路径？

使用 PHP 访问本地路径 PHP 可以访问本地文件，但需要注意，用户通过 URL 只能访问 Apache 环境中的文件。因此，要越过 Apache 访问本地文件，有两种方法：将文件写入一个 Apache 可访问的目录。该目录可以位于网站目录中，也可以创建指向该目录的虚拟目录。创建一个中介 PHP…

程序猿
2025年12月9日
0000
$PHP JSON 编码后，反斜杠被替换为 \/ 如何解决？$ 好文分享

PHP JSON 编码后，反斜杠被替换为 \/ 如何解决？

php json 编码后，反斜杠替换问题在 php 中，使用 json_encode 编码字符串时，可能会出现反斜杠被替换为 / 的问题。本文将针对该问题提供解决方案。问题描述以下代码用于查询数据库并将其结果编码为 json：立即学习“PHP免费学习笔记（深入）”； $result = my…

程序猿
2025年12月9日
0000
好文分享

Hyperf 重启时 AMQP 出现警告如何解决？

hyperf 重启时 amqp 出现警告的解决方法在重启 hyperf 时，如果遇到 amqp 异常，类似于下文的警告信息： [warning] recv loop broken. the reason is phpamqplibexceptionamqpconnectionclosedexcep…

程序猿
2025年12月9日
0000
好文分享

PHP 中如何安全存储混合代码？

PHP 中存储混合代码的最佳方式将 PHP 代码、HTML 代码和任意字符串存储到数据库中时，需要考虑编码问题。本文将介绍在存储和读取过程中实现数据完整性的最佳方法。存储时转为二进制 BLOB 字段：将混合代码转换为二进制流并将其存储在 BLOB 字段中。这将保留数据的原始格式。读取时立即…

程序猿
2025年12月9日
0000
好文分享

CakePHP 中读取变量时为何无法将其视为数组？

php 框架 cakephp 中读取变量的兼容性问题问题：在 cakephp 的 bootstrap.php 文件中设置变量时，使用如下格式： Configure::write(‘top_menu_show_count’, array( ‘PC’ => 8, ‘SP’ => 3 ))…

程序猿
2025年12月9日
0000
好文分享

如何通过 IP 定位服务获取访问者区域信息并提取相关数据？

根据 ip 定位区域提取区域信息本文探讨了如何通过获取访问者的 ip 地址，利用 ip 定位服务来判断其区域，并据此提取相关信息，例如区域经理电话。 ip 定位服务 ip 定位服务是一种在线工具，可以根据 ip 地址将访问者的位置信息解析为国家/地区、城市、邮政编码等信息。 html 实现要实现…

程序猿
2025年12月9日
0000
好文分享

Hyperf 重启时 AMQP 异常：如何处理警告信息？

hyperf 重启过程中 amqp 异常解析在 hyperf 重启时，可能会出现以下 amqp 异常： [WARNING] Recv loop broken. The reason is PhpAmqpLibExceptionAMQPConnectionClosedException: Broke…

程序猿
2025年12月9日
0000
好文分享

如何在 PHP 中安全存储 PHP 代码、HTML 代码和字符串？

如何在 PHP 中存储 PHP 代码、HTML 代码和字符串在 PHP 中存储各种类型的数据，包括 PHP 代码、HTML 代码和一般字符串，需要采取特定的方式来进行转码和存储。下面是具体步骤：存储过程使用 addslashes() 函数转义 PHP 代码和 HTML 代码中的单引号和双引号，…

程序猿
2025年12月9日
0000
好文分享

如何根据 IP 地址判断访问者区域并提取相关信息？

通过 ip 判断区域并提取信息正如您在问题中所描述的，您希望根据访问者的 ip 地址来判断其所在的区域，并提取与该区域相关的特定信息，例如区域经理的电话号码。以下是一种无需使用外部 api 的方法：您可以利用 html 的 geolocation api 来获取访问者的位置信息。该 api 提供…

程序猿
2025年12月9日
0000
好文分享

如何在 PHP 中安全地将代码和字符串存储在数据库中？

将不同类型的代码与字符串存储在数据库中在 PHP 中，存在需要将 PHP 代码、HTML 代码和其他杂乱字符串存储在数据库中的情况。为了正确执行此操作，需要考虑转码和还原步骤。转码保存为了将各种类型的代码存储在数据库中，需要将其转换为二进制形式。数据库提供了一个 BLOB（二进制大对象）字段，…

程序猿
2025年12月9日
0000
好文分享

如何在 MySQL 中存储和读取 PHP 代码？

如何将 php 代码嵌入 mysql blob 字段在 php 中需要存储自定义代码、html 片段或其他复杂数据时，使用 mysql blob (binary large object) 字段是个不错的选择。以下是如何操作：存入数据库连接到数据库。使用 addslashes() 函数转义数据…

程序猿
2025年12月9日
0000
好文分享

PHP 多维数组中，如何获取指定键名同级前一个数组的内容？

php 多维数组获取同级前一个数组问题：给定一个多维数组，如何通过一个函数根据一个“键名”获取到同级的前一个数组的内容？例如，给定以下数组：立即学习“PHP免费学习笔记（深入）”； $all = [];$a = [“horse” => “0”, “dog” => “1”, “ca…

程序猿
2025年12月9日
0000
好文分享

PHP json_encode() 编码中文出现乱码，如何解决？

json 编码中的中文乱码问题在使用 php 的 json_encode() 函数将中文数据编码为 json 时，可能会出现中文乱码的情况。在您提供的代码中，$users 数组中包含了以下数据： “name”: “杨” 编码后的 json 字符串中，”name” 的值显示…

程序猿
2025年12月9日
0000
好文分享

CakePHP 中如何使用 Configure::write() 写入数组？

cakephp 读取变量问题在 bootstrap.php 中，设置变量 top_menu_show_count 时遇到了问题，具体如下： Configure::write(‘top_menu_show_count’, array( ‘PC’ => 8, ‘SP’ => 3, )); …

程序猿
2025年12月9日
0000
好文分享

CakePHP 中如何读取配置数组变量？

cakephp 读取变量的困扰在使用 cakephp 框架的 bootstrap.php 文件中，您可能会设置变量如下所示： configure::write(‘top_menu_show_count’, [ ‘pc’ => 8, ‘sp’ => 3,]); 然而，您在访问该变量时却遇…

程序猿
2025年12月9日
0000
好文分享

AJAX如何解决传统网页保存方法的效率问题？

AJAX为何不适合将页面保存到数据库传统的做法中，整个HTML页面可能存储在数据库中，以便在用户请求时输出给他们。然而，对于动态页面来说，这种方法效率低下且不可用。如何使用AJAX更新页面内容如果用户需要修改页面内容，AJAX提供了发送修改内容到服务器而无需刷新整个页面的方法。使用AJAX的步…

程序猿
2025年12月9日
0000

发表回复

登录后才能评论

关注微信