通过 XPath 在指定标签中查找元素

程序猿 • 2026年5月10日 10:46:56 • 用户投稿 • 阅读 0

本文旨在介绍如何使用 XPath 表达式在 HTML 或 XML 文档中查找特定标签内的元素。我们将探讨如何限制搜索范围，使其仅限于 `span`、`h1`、`h2` 等指定的标签，并提供有效的 XPath 表达式示例，以帮助您更精确地定位目标元素。

在使用 XPath 进行元素查找时，有时我们需要将搜索范围限定在特定的 HTML 标签内，例如只在

、

和标签中查找符合条件的元素。直接使用 //* 会匹配所有标签，而简单的 //span|h1|h2 可能会导致意想不到的结果。本文将介绍如何正确地使用 XPath 表达式来实现这一目标。

使用 self:: 轴

XPath 提供了 self:: 轴，可以用来选择当前节点的指定类型。结合 or 运算符，我们可以构建一个 XPath 表达式，选择指定标签类型的元素。

以下是一个示例 XPath 表达式，用于选择文档中的所有 span、h1 或 h2 元素：

//*[self::span or self::h1 or self::h2]

解释:

//*: 选择文档中的所有元素。[…]: 使用谓词来过滤选择的元素。self::span: 检查当前元素是否为 span 标签。self::h1: 检查当前元素是否为 h1 标签。self::h2: 检查当前元素是否为 h2 标签。or: 逻辑或运算符，只要满足其中一个条件，就选择该元素。

示例:

假设有如下 HTML 代码：

  This is a heading
  This is a paragraph.
                                                                                                                                                    ASP.NET 4.0电子商城                            在现实生活中的购物过程，购物者需要先到商场，找到指定的产品柜台下，查看产品实体以及标价信息，如果产品合适，就将该产品放到购物车中，到收款处付款结算。电子商务网站通过虚拟网页的形式在计算机上摸拟了整个过程，首先电子商务设计人员将产品信息分类显示在网页上，用户查看网页上的产品信息，当用户看到了中意的产品后，可以将该产品添加到购物车，最后使用网上支付工具进行结算，而货物将由公司通过快递等方式发送给购物者
                                                                                            0                            
                        
                                                    查看详情                                                                        
                  This is a span.  This is another heading

使用上述 XPath 表达式，将会选中

This is a heading

、This is a span. 和

This is another heading

这三个元素。

结合 starts-with() 和 translate() 函数

如果需要在指定的标签内查找文本内容以特定字符串开头的元素，可以结合 starts-with() 和 translate() 函数。translate() 函数可以将文本转换为小写，从而实现大小写不敏感的匹配。

以下是一个示例，用于在 span、h1 或 h2 标签中查找文本内容以 “search” 开头的元素（忽略大小写）：

//*[(self::span or self::h1 or self::h2) and starts-with(translate(text(), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), 'search')]

解释:

//*[(self::span or self::h1 or self::h2)]: 选择所有 span、h1 或 h2 元素。and: 逻辑与运算符，必须同时满足两个条件。starts-with(translate(text(), ‘ABCDEFGHIJKLMNOPQRSTUVWXYZ’, ‘abcdefghijklmnopqrstuvwxyz’), ‘search’): 检查元素的文本内容（转换为小写后）是否以 “search” 开头。

示例代码（Python + Selenium）:

from selenium import webdriverfrom selenium.webdriver.common.by import Bydriver = webdriver.Chrome()  # 或者其他浏览器驱动driver.get("your_html_file.html") # 替换成你的HTML文件路径search_term = "example"xpath_expression = f"//*[(self::span or self::h1 or self::h2) and starts-with(translate(text(), 'ABCDEFGHIJKLMNOPQRSTUVWXYZ', 'abcdefghijklmnopqrstuvwxyz'), '{search_term.lower()}')]"elements = driver.find_elements(By.XPATH, xpath_expression)for element in elements:    print(element.text)driver.quit()

注意事项:

确保 XPath 表达式的语法正确。可以使用在线 XPath 验证工具来测试表达式。根据实际情况调整标签类型和搜索条件。translate() 函数在一些 XPath 引擎中可能不支持，可以考虑使用其他大小写不敏感的匹配方法。

总结

通过使用 self:: 轴和逻辑运算符，我们可以有效地限制 XPath 表达式的搜索范围，使其仅限于指定的标签。结合 starts-with() 和 translate() 函数，可以实现更复杂的文本内容匹配。在实际应用中，需要根据具体的 HTML 结构和需求，灵活运用这些技巧，编写出高效、准确的 XPath 表达式。

以上就是通过 XPath 在指定标签中查找元素的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1589135.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

c语言高精度怎么除法

上一篇 2026年5月10日 10:46:56

setTimeout与异步执行的关系

下一篇 2026年5月10日 10:46:59

用户投稿

Python 字符串：探索字符串操作方法

Python 字符串详解：字符串是 Python 中用单引号或双引号括起来的字符序列。例如： “你好，世界！”‘Python’“这是个问题吗？” 字符串类型：单行字符串：使用单引号 ( ‘这是一个字符串’ ) 或双引号 ( “这也是一个字符串” ) 创建。 print(‘hello worl…

程序猿
2026年5月10日
0000
Golang系统调用阻塞怎么排查？Golang非阻塞IO方案

golang系统调用阻塞问题可通过以下方法排查与解决：1. 使用profiling工具如go tool pprof分析cpu和内存使用，识别耗时最长的函数及系统调用阻塞点；2. 利用strace跟踪系统调用，查看耗时操作；3. 增加日志记录关键操作耗时；4. 检查资源限制如文件描述符数量；5. 进行…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

阻止搜索引擎爬虫触发网站非预期操作的指南

本教程旨在解决搜索引擎爬虫（如bingbot）因访问网站特定页面而意外触发邮件发送等非预期操作的问题。核心解决方案是遵循http协议规范，将执行状态变更操作的请求从get方法改为post方法，并辅以必要的认证机制，以确保网站功能的正确性和安全性，有效防止爬虫对网站造成干扰。理解搜索引擎爬虫与HTT…

程序猿
2026年5月10日
0000
用户投稿

C++STL查找算法find和binary_search使用

std::find适用于无序数据的线性查找，返回元素位置，时间复杂度O(N)；std::binary_search要求数据有序，仅判断存在性，时间复杂度O(log N)，效率更高。在C++ STL中， std::find 和 std::binary_search 是两种核心的查找算法，它们各自适用…

程序猿
2026年5月10日
1000
用户投稿

Yii2框架Gii工具怎么用_Yii2框架Gii代码生成器教程

答案：Yii2的Gii工具通过自动生成模型、控制器、视图等代码提升开发效率，需在config/web.php中配置gii模块并设置allowedIPs以启用；访问/gii路径可进入界面，使用Model、CRUD等生成器快速创建代码，支持自定义模板统一风格；生成的代码需手动集成权限、验证等功能，避免直…

程序猿
2026年5月10日
1000
用户投稿

怎样使用 JavaScript 的 Typed Arrays 处理二进制数据？

Typed Arrays通过ArrayBuffer实现对二进制数据的高效操作，需用视图如Int32Array或DataView访问，支持多种数据类型和字节序控制，适用于处理图像、音频等原始数据。 JavaScript 的 Typed Arrays 提供了一种高效处理二进制数据的方式，特别适用于操作原…

程序猿
2026年5月10日
1000
用户投稿

Bootstrap Accordion：防止所有手风琴同时展开及初始状态修复

Bootstrap Accordion：防止所有手风琴同时展开及初始状态修复本文旨在解决 Bootstrap 手风琴组件中多个手风琴同时展开的问题，并提供修复页面加载时手风琴箭头方向错误的方案。通过修改 HTML 结构中的 aria-labelledby 和 id 属性，确保每个手风琴项具有唯一的…

程序猿
2026年5月10日
1000
用户投稿

Trilium主题切换，HTML+CSS学习模式一键高颜值！

首先启用开发者模式并开启自定义CSS，接着在customCss笔记中定义亮色与暗色主题的CSS变量，并应用于body和侧边栏等元素，然后创建JavaScript脚本通过修改data-theme属性实现主题切换，最后扩展多套主题如“ocean”并更新脚本支持循环切换，完成界面个性化。如果您希望在Tr…

程序猿
2026年5月10日
0000
用户投稿

Python中优雅处理多重异常与变量作用域的实践指南

本文深入探讨了Python中处理多重异常时的常见陷阱与最佳实践，特别是涉及变量作用域的问题。通过分析一个典型的try-except结构，我们揭示了在不同异常分支中变量定义状态的重要性，并提出使用嵌套try-except块的有效解决方案。本教程旨在帮助开发者编写更健壮、更符合Pythonic风格的异常…

程序猿
2026年5月10日
0000
用户投稿

html5如何实现弹窗_HTML5模态框弹窗实现步骤与代码【弹窗】

可使用HTML5 dialog元素、div+CSS+JS手动实现、:target伪类无JS方案或SweetAlert2等第三方库创建强制交互弹窗；其中dialog语义清晰且原生支持模态行为，其余方案侧重兼容性、轻量性或功能丰富性。如果您希望在网页中创建一个用户无法绕过、必须交互的弹窗界面，则可以使…

程序猿
2026年5月10日
0000
用户投稿

JavaScript中模拟点击事件触发DOM元素的onclick功能

本教程详细阐述了如何在JavaScript中通过编程方式触发HTML元素的点击事件，以激活其关联的`onclick`功能或其他事件监听器。我们将介绍使用`element.click()`方法的最佳实践，并探讨其与直接调用`onclick`函数之间的区别，同时提供示例代码和注意事项，帮助开发者实现页面…

程序猿
2026年5月10日
0000
用户投稿

如何用TypeScript类型声明完善JavaScript单例Promise函数？

TypeScript类型声明完善JavaScript单例Promise函数本文介绍如何为javascript工具库编写精准的typescript类型声明文件(index.d.ts)，解决类型定义难题。重点在于singlepromise函数的完善类型定义，该函数创建一个单例promise函数，并支持…

程序猿
2026年5月10日
0000
确保Django应用中所有卡片按钮功能可用的方法

本文旨在解决Django模板循环渲染导致HTML元素ID重复，进而使JavaScript事件绑定失效的问题。我们将探讨如何通过动态生成唯一ID结合`querySelectorAll`批量绑定事件，以及更高效的事件委托机制，来确保所有卡片内的增减按钮及其计数器都能正常工作，提供详细的代码示例和最佳实践…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

解决 jQuery toggleClass 不响应问题的实用指南

在网页开发中，toggleClass 是一个非常实用的 jQuery 方法，用于在元素的类名列表中添加或删除一个或多个类名。然而，开发者在使用过程中可能会遇到 toggleClass 不响应的问题，导致预期效果无法实现。本文将深入探讨这个问题，并提供解决方案。理解 toggleClass 的基本用…

程序猿
2026年5月10日
0000
用户投稿

Avue按钮失效了，是什么原因导致的？

avue按钮失效排查指南图片：问题： Avue框架中的按钮点击失效，无报错信息。可能原因及解决方法： CSS样式冲突：自定义CSS样式可能意外覆盖了Avue按钮的默认样式，导致按钮无法响应点击事件。检查你的CSS代码，特别是:disabled和:hover伪类选择器，确保没有错误地覆盖Av…

程序猿
2026年5月10日
0000
用户投稿

Golang结构体字段与方法动态遍历示例

通过reflect.ValueOf和reflect.TypeOf获取结构体的值和类型信息，遍历其字段与方法；2. 利用反射可读取字段名、标签、值及调用方法，适用于通用库、序列化、ORM等场景。在Go语言中，结构体（struct）是复合数据类型的核心组成部分。通过反射（reflection），我们可…

程序猿
2026年5月10日
0000
用户投稿

HTX火币交易所app下载-HTX火币交易所最新版本下载v10.44.1

火币官方合作伙伴认证 · 一站式安全交易体验官网直达：安卓安装包下载： HTX（原火币）交易所App的下载需要通过其官方网站进行，以确保安全和获取最新版本。目前市场上存在大量仿冒应用，直接在第三方平台搜索容易下载到虚假或带有风险的程序。如何安全下载HTX App 要获取HTX官方App，请打开…

程序猿
2026年5月10日
0000
用户投稿

C# using static指令的用法 – 简化对静态成员的调用

using static 用于简化频繁调用的静态成员访问，应于大量使用 Math、Console、Enumerable 或自定义工具类静态方法时引入；需置于命名空间外、类前，注意同名冲突需手动限定，推荐结合 IDE 使用但避免滥用。 using static 指令让 C# 代码能直接调用指定类型中的…

程序猿
2026年5月10日
0000
用户投稿

解决 Angular 14 升级至 16 后第三方依赖兼容性错误与最佳实践

将 Angular 应用从版本 14 升级到 16 时，常见的挑战是处理第三方库的兼容性问题，尤其是在使用 `–force` 标志后可能导致大量编译错误。本文将提供一套系统的解决方案，包括识别过时依赖、逐一验证库兼容性、遵循官方升级指南，并强调避免强制安装以确保平滑升级，最终实现稳定运行…

程序猿
2026年5月10日
1000
用户投稿

如何在HTML元素悬停时显示动态数据提示

本文详细介绍了如何在Angular等前端框架中，利用HTML的`title`属性为元素添加动态数据提示（tooltip）。通过将表达式（如`{{ row.boxes.length }}`）嵌入到`title`属性中，可以实现在用户鼠标悬停时，显示包含实时计算结果的文本提示，从而提升用户体验，并避免直…

程序猿
2026年5月10日
0000