使用广度优先搜索（BFS）从Python字典中按层级提取数据

程序猿 • 2025年12月14日 15:22:23 • 用户投稿 • 阅读 0

本文探讨如何利用Python的广度优先搜索（BFS）算法，从一个嵌套字典中，根据起始列表和目标列表，按迭代层级提取数据。我们将详细介绍BFS的原理及其在处理此类图结构问题中的应用，并提供两种实现方式，确保高效且结构化地获取期望的输出。

1. 问题背景与目标

在处理复杂数据结构时，我们常会遇到需要从一个具有层级或图状关系的字典中，根据特定规则提取信息的情况。假设我们有一个表示有向图的字典my_dict，其中键是节点，值是其直接邻居节点列表。我们还定义了一个source_list作为起始节点集，以及一个target_list作为终止节点集。我们的目标是，从source_list中的每个节点开始，逐层遍历my_dict，直到遇到target_list中的任一节点为止。同时，我们希望将每次遍历层级（迭代）所发现的节点及其邻居组织成一个字典，最终输出一个以迭代次数为键的嵌套字典。

例如，给定以下数据：

source_list = ['a', 'b']target_list = ['x', 'y', 'z']my_dict = {    'a': ['e'],    'b': ['f', 'd'],    'e': ['g'],    'f': ['t', 'h'],    'd': ['x'],    'g': ['x'],    't': ['y'],    'h': ['z']}

期望的输出是：

{0: {'a': ['e'], 'b': ['f', 'd']}, 1: {'e': ['g'], 'f': ['t', 'h'], 'd': ['x']}, 2: {'g': ['x'], 't': ['y'], 'h': ['z']}}

这里，键0代表第一层迭代，包含从source_list直接可达的节点及其邻居；键1代表第二层迭代，包含从第一层节点可达的节点及其邻居，以此类推。

2. 为什么选择广度优先搜索（BFS）？

最初尝试的解决方案可能使用简单的循环结构，但往往难以正确地管理层级关系并按期望的迭代次数组织输出。这种按层级（或深度）遍历数据结构的需求，正是广度优先搜索（BFS）算法的典型应用场景。

立即学习“Python免费学习笔记（深入）”；

BFS是一种用于遍历或搜索树或图的算法。它从图的某个节点开始，首先访问其所有邻居节点，然后访问这些邻居节点的邻居，依此类推。换句话说，它会先访问距离起始节点“最近”的所有节点，然后再访问距离次之的节点，确保了按层级（或迭代）进行探索。这与我们的需求完美契合，因为我们需要精确地记录每一层迭代所发现的节点。

3. 基于BFS的解决方案实现

我们将介绍两种基于BFS的实现方式。

3.1 基础BFS实现

此实现使用collections.deque作为队列，以高效地管理待访问节点。它通过在队列中存储(level, node)元组来跟踪当前节点的层级。

from collections import dequedef bfs_fetch_by_level(source_nodes, target_nodes, graph_dict):    """    使用广度优先搜索从字典中按层级提取数据。    Args:        source_nodes (list): 起始节点列表。        target_nodes (list): 目标节点列表。        graph_dict (dict): 表示图结构的字典，键为节点，值为其邻居列表。    Returns:        dict: 按层级组织的提取结果字典。    """    queue = deque((0, node) for node in source_nodes) # 队列存储 (层级, 节点)    target_set = set(target_nodes) # 目标节点集合，用于快速查找    seen = set(source_nodes) # 已访问节点集合，防止重复访问和循环    result = {} # 存储最终结果    while queue:        level, current_node = queue.popleft() # 取出当前层级和节点        # 获取当前节点的邻居，如果不存在则为空列表        neighbors = graph_dict.get(current_node, [])        # 将当前节点及其邻居添加到结果字典的对应层级中        result.setdefault(level, {})[current_node] = neighbors[:] # 使用[:]进行浅拷贝，避免修改原始列表        for neighbor in neighbors:            # 如果邻居节点已访问过或在目标列表中，则跳过            # 如果在目标列表中，我们不希望继续探索其子节点，因为已达到目标            if neighbor in seen or neighbor in target_set:                continue            seen.add(neighbor) # 标记为已访问            queue.append((level + 1, neighbor)) # 将邻居加入队列，层级加1    return result# 示例使用source_list = ['a', 'b']target_list = ['x', 'y', 'z']my_dict = {    'a': ['e'],    'b': ['f', 'd'],    'e': ['g'],    'f': ['t', 'h'],    'd': ['x'],    'g': ['x'],    't': ['y'],    'h': ['z']}output_bfs = bfs_fetch_by_level(source_list, target_list, my_dict)print(output_bfs)

输出：

{0: {'a': ['e'], 'b': ['f', 'd']}, 1: {'e': ['g'], 'f': ['t', 'h'], 'd': ['x']}, 2: {'g': ['x'], 't': ['y'], 'h': ['z']}}

代码解析：

deque初始化： 队列中存储的是(层级, 节点)元组。起始节点都在第0层。target_set与seen： target_set用于快速判断一个节点是否为目标节点。seen集合用于记录已访问过的节点，防止重复处理和陷入图中的循环。while queue循环： BFS的核心循环，当队列非空时持续进行。result.setdefault(level, {})[current_node] = neighbors[:]： 这行代码巧妙地构建了输出。setdefault(level, {})确保result字典中存在当前level的键，并将其值初始化为一个空字典（如果不存在）。然后，将current_node作为键，其邻居列表作为值添加到这个内部字典中。使用neighbors[:]创建邻居列表的浅拷贝，避免原始graph_dict的意外修改。邻居遍历与条件判断： 对于每个邻居，我们检查它是否已经访问过 (neighbor in seen) 或者它是否是目标节点 (neighbor in target_set)。如果满足任一条件，我们就不再深入探索这个邻居，因为：如果已访问，继续探索会形成循环或重复路径。如果是目标节点，我们已达到该路径的终点，无需再将其子节点加入队列。queue.append((level + 1, neighbor))： 将未访问且非目标节点的邻居加入队列，并将其层级设置为当前层级加一。

3.2 优化层级构建的BFS实现

第二种实现方式在构建每一层结果时略有不同，它通过一个内部循环来确保当前层的所有节点都被处理完毕，然后才递增层级。这种方式可能在某些情况下更清晰地表达层级概念。

from collections import dequedef build_level_dict(graph, queue, seen, target_set):    """    辅助函数：构建当前层级的字典。    """    # 记录当前层级的最后一个节点，用于判断何时结束本层处理    current_level_end_node = queue[-1] if queue else None     level_dict = {}    while True:        node = queue.popleft()        neighbors = graph.get(node, [])        level_dict[node] = neighbors[:]        for neighbor in neighbors:            if neighbor in seen or neighbor in target_set:                continue            seen.add(neighbor)            queue.append(neighbor)        if node == current_level_end_node: # 当前层所有节点已处理完毕            return level_dictdef optimized_bfs_fetch_by_level(source_nodes, target_nodes, graph_dict):    """    优化版广度优先搜索，按层级提取数据。    """    target_set = set(target_nodes)    result = {}    # 初始已访问节点包含源节点    seen = set(source_nodes)     queue = deque(source_nodes) # 队列只存储节点，层级通过外部循环管理    level = 0    while queue:        # 调用辅助函数构建当前层级的结果        result[level] = build_level_dict(graph_dict, queue, seen, target_set)        level += 1 # 层级递增    return result# 示例使用source_list = ['a', 'b']target_list = ['x', 'y', 'z']my_dict = {    'a': ['e'],    'b': ['f', 'd'],    'e': ['g'],    'f': ['t', 'h'],    'd': ['x'],    'g': ['x'],    't': ['y'],    'h': ['z']}output_optimized_bfs = optimized_bfs_fetch_by_level(source_list, target_list, my_dict)print(output_optimized_bfs)

输出：

{0: {'a': ['e'], 'b': ['f', 'd']}, 1: {'e': ['g'], 'f': ['t', 'h'], 'd': ['x']}, 2: {'g': ['x'], 't': ['y'], 'h': ['z']}}

代码解析：

queue初始化： 队列中只存储节点，不再存储层级元组。seen初始化： 在开始时就将source_nodes加入seen，表示这些节点已“访问”或“处理”，避免重复从它们开始。build_level_dict函数： 这是核心优化点。它接收graph、queue、seen和target_set。current_level_end_node = queue[-1]：在处理当前层级之前，记录队列中最后一个节点。这样，当popleft()取出的节点是这个current_level_end_node时，就意味着当前层的所有节点都已处理完毕。内部while True循环：持续从队列中取出节点，构建level_dict，并将其邻居加入队列。if node == current_level_end_node: return level_dict：当处理到当前层的最后一个节点时，返回构建好的level_dict。optimized_bfs_fetch_by_level主函数： 外部while queue循环负责管理层级level，每次循环调用build_level_dict来构建当前层的结果。

4. 注意事项与总结

图的表示： 这里的my_dict本质上是一个邻接列表表示的图。键是节点，值是其直接可达的邻居节点列表。deque的优势： collections.deque（双端队列）相比于普通Python列表，在两端添加和删除元素（如popleft()）时具有O(1)的时间复杂度，这对于BFS算法的性能至关重要。seen集合的重要性： seen集合是防止无限循环和重复计算的关键，尤其是在处理可能包含循环的图时。如果您的my_dict保证是一个树结构（无循环），那么seen集合可以简化或移除，但通常保留它更为安全。target_set： 将target_nodes转换为set可以使查找操作（neighbor in target_set）的平均时间复杂度从O(N)降低到O(1)，提高效率。浅拷贝neighbors[:]： 在将邻居列表赋值给结果字典时，使用[:]进行浅拷贝是一个好习惯，可以避免在后续操作中无意修改原始graph_dict中的列表。算法复杂度： BFS的时间复杂度通常是O(V + E)，其中V是图中的顶点数，E是边数。空间复杂度是O(V)，用于存储队列和seen集合。

通过这两种基于广度优先搜索的实现，我们能够有效地从复杂的嵌套字典结构中，按照指定的起始节点和目标节点，按层级迭代地提取所需数据，并以清晰的结构化格式呈现。这种方法不仅适用于本例中的特定场景，也广泛应用于各种图遍历和最短路径查找问题。

以上就是使用广度优先搜索（BFS）从Python字典中按层级提取数据的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1375833.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

python Paramiko的SSH用法

上一篇 2025年12月14日 15:22:20

解决 preview-generator 在 Windows 上的安装问题

下一篇 2025年12月14日 15:22:28

用户投稿

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
15000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 用户投稿
5000
用户投稿

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
3000
用户投稿

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
4000
用户投稿

为什么我的特定 DIV 在 Edge 浏览器中无法显示？

特定 DIV 无法显示：用户代理样式表的困扰当你在 Edge 浏览器中打开项目中的某个 div 时，却发现它无法正常显示，仔细检查样式后，发现是由用户代理样式表中的 display none 引起的。但你疑问的是，为什么会出现这样的样式表，而且只针对特定的 div？背后的原因用户代理样式表是由…

程序猿
2025年12月24日
3000
用户投稿

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
1000
用户投稿

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
用户投稿

为什么使用 inline-block 元素时会错位？

inline-block 元素错位成因剖析在使用 inline-block 元素时，可能会遇到它们错位显示的问题。如代码 demo 所示，当设置了 overflow 属性时，a 标签就会错位下沉，而未设置时却不会。问题根源： overflow:hidden 属性影响了 inline-block …

程序猿
2025年12月24日
1000
用户投稿

为什么我的 CSS 元素放大效果无法正常生效？

css 设置元素放大效果的疑问解答原提问者在尝试给元素添加 10em 字体大小和过渡效果后，未能在进入页面时看到放大效果。探究发现，原提问者将 CSS 代码直接写在页面中，导致放大效果无法触发。解决办法如下：将 CSS 样式写在一个单独的文件中，并使用标签引入该样式文件。这个操作与原提问者观…

程序猿
2025年12月24日
1000
用户投稿

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
3000
用户投稿

为什么在父元素为inline或inline-block时，子元素设置width: 100%会出现不同的显示效果？

width:100%在父元素为inline或inline-block下的显示问题问题提出当父元素为inline或inline-block时，内部元素设置width:100%会出现不同的显示效果。以代码为例：测试内容这是inline-block span 效果1：父元素为inline-bloc…

程序猿
2025年12月24日
5000
用户投稿

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
用户投稿

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
3000
用户投稿

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
用户投稿

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
1000
用户投稿

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
用户投稿

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
4000
用户投稿

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
用户投稿

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
用户投稿

html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

在HTML5中执行JavaScript需通过script标签：一、内联编写于head或body中；二、外链引入.js文件并建议放body末尾或加defer；三、defer按序执行，async独立执行；四、可动态创建script元素插入执行。如果您希望在HTML5页面中执行JavaScript代码，…

程序猿
2025年12月23日
0000