使用Selenium获取父元素下所有特定子元素的教程

程序猿 • 2025年11月11日 01:30:13 • web前端 • 阅读 1

本教程旨在指导如何使用Selenium WebDriver从一个父HTML元素中高效地提取所有符合特定条件的子元素。我们将重点讲解`find_elements`方法的应用，并提供基于CSS选择器和XPath两种策略的详细示例，确保能够一次性获取所有匹配的子元素，而非仅限于第一个。

在自动化测试或网页数据抓取场景中，经常需要从一个特定的父元素（例如一个div）中提取所有符合某种模式的子元素。例如，从一个包含多个span元素的div中，获取所有具有特定类名的span元素的文本内容。如果错误地使用了find_element方法，则只会返回第一个匹配的元素，从而遗漏其他所需的数据。

区分 find_element 与 find_elements

Selenium WebDriver提供了两种主要的方法来查找元素：

find_element(): 返回页面上第一个匹配指定定位器策略的元素。如果未找到元素，则会抛出 NoSuchElementException 异常。find_elements(): 返回页面上所有匹配指定定位器策略的元素列表。如果没有找到任何元素，则返回一个空列表。

因此，当需要获取多个子元素时，必须使用 find_elements() 方法。

示例场景分析

假设有以下HTML结构，我们目标是获取所有class为 “indigo-text descfont” 的span标签的文本内容，即 “Alsace” 和 “2014”。

 ... Alsace 
 ... 2014

如果尝试使用类似 details.find_element_by_xpath(“//span[starts-with(@class,’indigo-text descfont’)]”) 的代码，它只会返回第一个匹配的 span 元素（即 “Alsace”），因为 find_element 仅查找第一个。

解决方案：使用 find_elements 获取所有子元素

为了获取所有匹配的 span 元素，我们需要结合 find_elements 方法和精确的定位器策略。这里我们将介绍两种常用的定位器：CSS 选择器和 XPath。

腾讯元宝

腾讯混元平台推出的AI助手

223 查看详情

首先，确保导入必要的模块：

from selenium import webdriverfrom selenium.webdriver.common.by import By

1. 使用 CSS 选择器

CSS 选择器是一种简洁高效的元素定位方式。对于上述HTML结构，我们可以构建一个CSS选择器来精确定位 id 为 WineDetailContent 的 div 内部所有 class 为 indigo-text 和 descfont 的 span 元素。

div#WineDetailContent: 匹配 id 为 WineDetailContent 的 div 元素。span.indigo-text.descfont: 匹配同时具有 indigo-text 和 descfont 两个类的 span 元素。div#WineDetailContent span.indigo-text.descfont: 组合起来，表示在 id 为 WineDetailContent 的 div 元素内部，查找所有符合 span.indigo-text.descfont 条件的元素。

示例代码：

# 假设 driver 已经初始化并加载了包含上述HTML的页面# driver = webdriver.Chrome() # driver.get("your_page_url")# 使用 CSS_SELECTOR 定位所有匹配的 span 元素span_elements = driver.find_elements(By.CSS_SELECTOR, "div#WineDetailContent span.indigo-text.descfont")# 使用列表推导式提取每个元素的文本内容texts = [element.text for element in span_elements]print(texts) # 预期输出: ['Alsace', '2014']

2. 使用 XPath

XPath 提供了更强大的定位能力，可以根据元素的层级关系、属性值、文本内容等进行复杂查询。

//div[@id=’WineDetailContent’]: 匹配页面上任意位置 id 为 WineDetailContent 的 div 元素。//span[@class=’indigo-text descfont’]: 匹配页面上任意位置 class 为 indigo-text descfont 的 span 元素。//div[@id=’WineDetailContent’]//span[@class=’indigo-text descfont’]: 组合起来，表示在 id 为 WineDetailContent 的 div 元素下的任意后代中，查找 class 为 indigo-text descfont 的 span 元素。注意这里的 // 表示任意后代，而 / 表示直接子元素。

示例代码：

# 假设 driver 已经初始化并加载了包含上述HTML的页面# driver = webdriver.Chrome() # driver.get("your_page_url")# 使用 XPATH 定位所有匹配的 span 元素span_elements = driver.find_elements(By.XPATH, "//div[@id='WineDetailContent']//span[@class='indigo-text descfont']")# 使用列表推导式提取每个元素的文本内容texts = [element.text for element in span_elements]print(texts)# 预期输出: ['Alsace', '2014']

注意事项与最佳实践

导入 By 类： 在使用 find_elements 时，务必从 selenium.webdriver.common.by 导入 By 类，以便指定定位器类型（如 By.CSS_SELECTOR 或 By.XPATH）。处理空列表： find_elements 在未找到任何匹配元素时会返回一个空列表 []，而不是抛出异常。在处理返回结果时，应考虑这个情况，避免对空列表进行操作而引发错误。

span_elements = driver.find_elements(By.CSS_SELECTOR, "some_non_existent_selector")if span_elements:    # 进行操作    texts = [e.text for e in span_elements]else:    print("未找到任何匹配元素。")

定位器选择：CSS 选择器通常比 XPath 更快、更简洁，在大多数情况下是首选。XPath 在处理复杂层级关系、不基于属性定位或需要基于文本内容定位时更为强大和灵活。定位器健壮性： 编写定位器时，尽量选择稳定且唯一的属性（如 id），避免使用易变的属性（如动态生成的 class 或位置索引），以提高脚本的健壮性。

总结

通过本教程，我们学习了如何利用 Selenium WebDriver 的 find_elements() 方法，结合 CSS 选择器或 XPath 表达式，从父元素中高效地获取所有符合特定条件的子元素。理解 find_element 和 find_elements 之间的区别是关键，而掌握精确的定位器编写技巧则是实现自动化和数据抓取的基石。在实际应用中，根据具体场景选择合适的定位器策略，并注意处理可能出现的空结果，将有助于构建稳定可靠的自动化脚本。

以上就是使用Selenium获取父元素下所有特定子元素的教程的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/610984.html

ai css css选择器 go html html元素 webdriver win 区别

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

289.3K 文章

0 评论

1 粉丝

这个人很懒，什么都没有留下～

构建富文本编辑器：实现用户自定义文本颜色功能

上一篇 2025年11月11日 01:29:38

JavaScript中动态DOM元素选取与事件绑定：避免异步加载陷阱

下一篇 2025年11月11日 01:31:33

好文分享

Typecho主题白天夜晚模式切换失效怎么办？

typecho主题白天夜晚模式切换失效？刷新后模式丢失？许多Typecho用户在尝试添加白天/夜晚模式切换功能后，发现切换效果无法持久，刷新页面后设置便会失效。本文提供解决方案，帮助您解决此问题。问题描述: 按照网上教程添加白天夜晚模式切换代码到footer.php后，刷新或点击链接，模式设置无…

程序猿
2025年12月10日
0000
好文分享

MySQL正则替换：如何用REGEXP_REPLACE()删除“@&”及其后的内容？

MySQL REGEXP_REPLACE() 函数实现特定字符串及后续内容的正则替换本文介绍如何使用MySQL的REGEXP_REPLACE()函数，删除字段中“@&”及其后的所有内容。需求：需要处理包含如下格式数据的字段： 123@&baidugoogle@&sohu …

程序猿
2025年12月10日
0000
好文分享

如何设计MySQL+PHP商城每周抽奖活动及奖金分配统计系统？

基于MySQL和PHP的商城每周抽奖活动及奖金分配统计系统本文阐述一个设计方案，用于实现商城每周抽奖活动，并对奖金进行统计和分配。系统需求：该系统需满足以下功能需求：立即学习“PHP免费学习笔记（深入）”；参与资格：每周交易次数达到10次的用户方可参与抽奖。奖金分配：当期奖池的50%按…

程序猿
2025年12月10日
0000
好文分享

递归函数中`$level + 1`与`++$level`参数传递方式有何区别？

递归函数参数传递：$level + 1 vs ++$level 本文分析递归函数中参数传递方式 $level + 1 和 ++$level 的区别，并以 gettreecategory() 函数为例说明其对递归结果的影响。该函数用于遍历类别列表并构建树状结构，接收类别列表、当前类别ID和递归深度 l…

程序猿
2025年12月10日
0000
好文分享

递归函数参数传递的差异：++$level与$level + 1的区别是什么？

递归函数参数传递的微妙之处本文探讨递归函数中参数传递的细节，尤其关注++$level和$level + 1两种方式的差异。以gettreecategory()函数为例，该函数使用三个参数：$cat_list、$cat_id和$level（表示递归深度）。如果将$level作为第三个参数传递给递…

程序猿
2025年12月10日
0000
好文分享

MySQL中如何用正则表达式替换特定字符串及其后内容？

MySQL正则表达式替换：删除特定字符串及后续内容本文介绍如何在MySQL中使用正则表达式替换特定字符串及其之后的所有内容。例如，数据库字段中以“@&”分隔的数据，可以使用regexp_replace函数进行处理。 regexp_replace函数用法： regexp_replace(目标…

程序猿
2025年12月10日
0000
好文分享

Java免签支付App监控代码如何添加“你已成功收款”消息的检测功能？

增强Java免签支付App监控代码，实现“你已成功收款”消息检测现有代码能够识别支付宝收款通知栏中“某某人通过扫码收款”类型的消息，但无法识别“你已成功收款”类型的消息。为了解决这个问题，只需在代码中添加一个简单的判断条件： if (v0.contains(“通过扫码向你付款”) || v0.c…

程序猿
2025年12月10日
0000
好文分享

MySQL字符查询不准确：字符集和排序规则如何影响搜索结果？

MySQL字符集差异导致查询结果不精确在MySQL数据库中，字符查询不精确的问题通常源于字符集设置的差异。例如，搜索“竹”字时，结果中可能意外包含“⺮”字。这是因为MySQL数据库默认的字符集和排序规则可能将这两个字识别为相同字符。造成此现象的原因在于排序规则。排序规则决定了字符的排列顺序。My…

程序猿
2025年12月10日
0000
好文分享

CI框架中如何异步渲染移动端列表页的分类新闻？

使用CI框架异步加载移动端分类新闻本文介绍如何利用CodeIgniter (CI)框架实现移动端列表页分类新闻的异步加载，提升用户体验。实现步骤：前端 (JavaScript): 为每个分类标题添加点击事件监听器，并将分类ID作为参数传递。使用AJAX向后端发送请求，获取指定分类的新闻数据。 …

程序猿
2025年12月10日
0000
好文分享

如何用原生PHP构建网站？从语法到数据库连接的完整指南

原生PHP网站开发：从基础语法到数据库连接想用PHP从零开始构建网站？本文提供一些实用建议和技巧，助您快速入门。框架优先：提升效率直接使用原生PHP开发网站效率低下且易出错。建议学习并使用PHP框架，例如ThinkPHP5，它能提供丰富的功能和简化的开发流程，显著提高开发效率。立即学习“PH…

程序猿
2025年12月10日
0000
好文分享

CodeIgniter框架下如何实现异步处理分类渲染以提升移动端网站性能？

提升移动端网站性能：CodeIgniter框架下的异步分类渲染移动端网站列表页面的用户体验至关重要。本文将介绍如何利用CodeIgniter框架实现异步处理分类渲染，从而优化用户体验。实现方案我们采用简洁高效的Ajax请求实现异步渲染。用户点击不同分类时，系统会向服务器发送包含分类标识的请求。…

程序猿
2025年12月10日
0000
好文分享

MySQL+PHP抽奖活动：如何设计高效的数据库表结构及数据统计方案？

MySQL与PHP抽奖活动：高效数据库设计及数据统计方案本文介绍一个基于MySQL和PHP的抽奖活动方案，重点阐述数据库表结构设计和数据统计方法，确保活动高效运行。数据库表结构为实现高效的数据管理，我们设计以下三个数据库表：立即学习“PHP免费学习笔记（深入）”；用户订单表 (orders…

程序猿
2025年12月10日
0000
好文分享

MySQL中“⺮”和“竹”为何被视为同一字符？

MySQL数据库中“⺮”和“竹”字符混淆的原因及解决方法在MySQL数据库进行文本搜索时，用户可能会发现“⺮”和“竹”这两个字被系统识别为同一个字符。这是由于MySQL的字符集和排序规则导致的。根本原因在于MySQL使用的字符集及其对应的排序规则。不同的排序规则对字符的排序方式有所不同。“⺮”和…

程序猿
2025年12月10日
0000
好文分享

递归函数中`$level+1`与`++$level`的区别是什么？

深入理解递归函数中的$level + 1和++$level 本文分析getTreeCategory()递归函数中，参数$level分别使用$level + 1和++$level时，输出结果不同的原因。该函数在遍历树形结构时，$level参数用于表示当前节点的层级深度。实验结果对比：我们观察到，…

程序猿
2025年12月10日
0000
好文分享

MySQL中如何用正则表达式替换指定字符串及之后文本？

MySQL中如何利用正则表达式替换特定字符串及其后续文本本文介绍如何在MySQL数据库中使用正则表达式替换指定字符串及其后的所有内容。假设您的表字段包含如下数据： 123@&baidugoogle@&sohu 目标是移除所有以”@&”开头的字符串及…

程序猿
2025年12月10日
0000
好文分享

递归函数中$level参数：$level + 1与++$level有什么区别？

递归函数参数传递差异分析递归函数中参数的传递方式会直接影响函数的执行流程。本文分析getTreeCategory()函数中第三个参数$level在if()条件语句中打印值差异的原因。使用$level + 1进行参数传递时，每次递归调用都会基于原$level值增加1。因此，打印的$level值会呈…

程序猿
2025年12月10日
0000
好文分享

PHP SOAP请求：如何使用PHP发送SOAP请求并处理错误？

利用PHP高效发送SOAP请求及错误处理本文将指导您如何使用PHP发送SOAP请求并有效处理可能出现的错误。代码示例：获取SOAP函数和类型列表以下代码演示如何获取SOAP服务的函数和类型列表：立即学习“PHP免费学习笔记（深入）”； $wsdl = “https://www.xxx.com…

程序猿
2025年12月10日
0000
好文分享

PHP SOAP请求：如何使用PHP发送和接收SOAP数据？

PHP SOAP客户端：发送和接收SOAP数据本文介绍如何使用PHP创建SOAP客户端，发送SOAP请求并处理响应数据。一、创建SOAP客户端首先，使用SoapClient类创建一个SOAP客户端对象。需要提供WSDL文件的URL：立即学习“PHP免费学习笔记（深入）”； $wsdl = “…

程序猿
2025年12月10日
0000
好文分享

递归函数传参：递增局部变量$level与++$level有何区别？

递归函数参数传递中的微妙差异本文探讨递归函数中参数传递的细节，特别是递增局部变量的不同处理方式对最终结果的影响。以下面的getTreeCategory()函数为例，分析$level + 1和++$level两种递增方式的区别。该函数的第三个参数$level用于表示递归深度。实验表明，使用$le…

程序猿
2025年12月10日
0000
好文分享

PHP Tea算法解密：如何用密钥0x04,0x03,0x02,0x01解密数据22611991475B6B6F？

PHP TEA算法解密实战：案例分析数据安全在开发中至关重要。本文通过一个PHP TEA算法解密案例，演示如何使用PHP代码进行解密操作。案例背景：我们需要解密一段使用TEA算法加密的数据。已知条件如下：立即学习“PHP免费学习笔记（深入）”；密钥: 0x04, 0x03, 0x02, 0…

程序猿
2025年12月10日
0000