Python中高效访问多层嵌套JSON/字典数据

python中高效访问多层嵌套json/字典数据

针对Python中处理复杂JSON或字典结构时,如何准确高效地提取深层嵌套数据的问题,本文将详细介绍直接索引、循环遍历以及使用json_normalize等多种方法。通过实例代码,读者将掌握如何定位并提取列表中的字典值,避免常见的索引错误,从而提升数据处理的准确性和效率。

1. 理解多层嵌套数据结构

在数据处理中,JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,常用于前后端数据传输或API响应。JSON数据通常以键值对(对应Python中的字典)和有序列表(对应Python中的列表)的形式组织,并且这些结构可以相互嵌套,形成复杂的多层结构。

例如,以下是一个典型的嵌套JSON结构片段:

{  "liveData": {    "plays": {      "allPlays": [        {          "runners": [            {              "details": {                "event": "Single",                "runner": {                  "id": 656941,                  "fullName": "Kyle Schwarber"                },                "isScoringEvent": false              }            }          ]        },        {          "runners": [            {              "details": {                "event": "Walk",                "runner": {                  "id": 123456,                  "fullName": "Another Runner"                },                "isScoringEvent": false              }            }          ]        }      ]    }  }}

在这个结构中,liveData是一个字典,其内部的plays也是字典,allPlays是一个列表,列表中每个元素又是一个字典,其中包含runners列表,runners列表中的每个元素又是一个字典,再包含details字典,最终在details内部的runner字典中找到我们需要的id值。

2. 直接索引法访问特定值

当数据的路径已知且唯一时(例如,我们确定要访问第一个play中的第一个runner的id),可以直接通过连续的键(针对字典)和索引(针对列表)来访问目标值。

立即学习“Python免费学习笔记(深入)”;

import jsonjson_data_str = """{  "liveData": {    "plays": {      "allPlays": [        {          "runners": [            {              "details": {                "event": "Single",                "runner": {                  "id": 656941,                  "fullName": "Kyle Schwarber"                },                "responsiblePitcher": null,                "isScoringEvent": false,                "rbi": false,                "earned": false,                "teamUnearned": false,                "playIndex": 6              }            }          ]        }      ]    }  }}"""# 将JSON字符串解析为Python字典data = json.loads(json_data_str)# 直接通过键和索引链式访问 'id' 值# 注意:这种方法要求路径上的所有键和索引都必须存在,否则会引发 KeyError 或 IndexErrortry:    id_value = data["liveData"]["plays"]["allPlays"][0]["runners"][0]["details"]["runner"]["id"]    print(f"直接索引法提取的ID: {id_value}")except (KeyError, IndexError) as e:    print(f"直接索引失败: {e}。请检查数据结构或使用更安全的访问方式。")

优点: 代码简洁,直观。缺点: 缺乏健壮性,如果路径中任何一个键不存在或列表为空,程序将抛出KeyError或IndexError。

3. 循环遍历法处理列表嵌套

在实际应用中,列表中的元素数量通常是动态的,或者我们需要提取所有符合条件的id值,而非仅仅第一个。此时,循环遍历是更通用和健壮的方法。

原始问题中,用户尝试x = play[‘runners’][‘details’]时遇到了’details’ is not an acceptable index since it is a string and not an integer or a slice的错误。这是因为play[‘runners’]是一个列表,不能直接使用字符串’details’作为索引。正确的做法是先访问列表中的元素(例如通过循环),然后再访问元素的键。

import jsonjson_data_str = """{  "liveData": {    "plays": {      "allPlays": [        {          "runners": [            {              "details": {                "event": "Single",                "runner": {                  "id": 656941,                  "fullName": "Kyle Schwarber"                },                "isScoringEvent": false              }            },            {              "details": {                "event": "Walk",                "runner": {                  "id": 123456,                  "fullName": "Another Runner"                },                "isScoringEvent": false              }            }          ]        },        {          "runners": [            {              "details": {                "event": "Double",                "runner": {                  "id": 789012,                  "fullName": "Third Runner"                },                "isScoringEvent": false              }            }          ]        },        {            "someOtherPlayData": "此play不包含runners"        }      ]    }  }}"""data = json.loads(json_data_str)extracted_ids = []# 使用 .get() 方法安全地访问字典键,避免 KeyErrorall_plays = data.get("liveData", {}).get("plays", {}).get("allPlays", [])for play in all_plays:    # 检查 'runners' 键是否存在且其值非空    runners = play.get("runners")    if runners and isinstance(runners, list): # 确保 runners 是一个列表        for runner_entry in runners:            details = runner_entry.get("details")            if details and isinstance(details, dict): # 确保 details 是一个字典                runner_info = details.get("runner")                if runner_info and isinstance(runner_info, dict): # 确保 runner_info 是一个字典                    runner_id = runner_info.get("id")                    if runner_id is not None: # 确保 id 值存在                        extracted_ids.append(runner_id)print(f"循环遍历法提取的所有ID: {extracted_ids}")

优点: 健壮性强,能够处理缺失键或空列表的情况;可以提取所有符合条件的值。缺点: 对于非常深层或复杂的嵌套,代码可能变得

以上就是Python中高效访问多层嵌套JSON/字典数据的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1367322.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
什么是资产代币化(Asset Tokenization)?它如何将现实世界资产带入区块链?
上一篇 2026年5月10日 10:55:15
C++数据预取技术 硬件预取器利用
下一篇 2026年5月10日 10:55:26

相关推荐

  • HTML怎么设置卡片布局?

    HTML怎么设置卡片布局?HTML怎么设置卡片布局?HTML怎么设置卡片布局?HTML怎么设置卡片布局?

    实现html卡片布局的核心方法有两种:1.使用flexbox,通过设置display: flex、flex-wrap: wrap和justify-content: space-around等属性控制卡片的一维排列;2.使用grid,通过grid-template-columns: repeat(au…

    2026年5月10日 用户投稿
    000
  • CSS层叠上下文与z-index:确保元素在叠加层上方可见的教程

    本教程探讨了如何利用css的`z-index`属性解决元素被背景叠加层(如线性渐变)遮挡的问题。通过调整目标元素的`z-index`使其高于叠加层,我们可以确保按钮或其他交互元素始终在视觉上位于前景,保持其可访问性和功能性,从而优化用户界面体验。 引言:理解CSS叠加层与元素可见性 在现代网页设计中…

    2026年5月10日
    000
  • C# 如何使用Channel – .NET中高性能的生产者消费者队列

    Channel 是 .NET 5+ 推荐的异步生产者-消费者通信原语,相比 Queue 和 BlockingCollection 更轻量、支持无锁操作、内置完成与取消感知,具备有界/无界模式以控制背压,Reader/Writer 可分离实现组件解耦,配合 TryRead 批处理与 WriteAsyn…

    用户投稿 2026年5月10日
    000
  • 超越 C++ 框架限制:探索替代方案

    c++++ 框架的替代方案有以下几种选择:开发自有代码库,提供最大灵活性,但开发和维护工作量大。使用库,可快速减少开发时间,但可能引入依赖关系和性能限制。利用脚本语言,实现快速原型制作和自动化,但性能有限。 超越 C++ 框架限制:探索替代方案 C++ 虽然是一个功能强大的语言,但其框架可能会限制开…

    2026年5月10日
    000
  • Python协程中为什么可以使用线程?

    Python 协程与线程的结合 在 Python 中,使用 asyncio 运行协程时,你可能会发现可以在协程内部创建和使用线程。这引发了一个问题:为什么协程内部可以创建线程? 原因在于:协程是 Python 层面的概念,而非操作系统层面的概念。它本质上只是代码执行流程的一种控制方式,类似于普通的 …

    2026年5月10日
    000
  • 编程实践:如何正确实现变量累加与遵循代码指令

    本文探讨在编程中实现变量累加的正确方法,强调即使程序输出结果正确,也必须严格遵循代码指令和逻辑规范。通过对比直接求和赋值与逐步累加两种方式,详细阐述了变量累加的最佳实践,并强调了遵循指令对于代码可读性、可维护性及团队协作的重要性。 理解变量累加的正确姿势 在软件开发过程中,我们经常会遇到需要对一系列…

    2026年5月10日
    100
  • c++如何使用unordered_map_c++哈希映射容器用法讲解

    unordered_map是基于哈希表的键值对容器,提供均摊O(1)的查找、插入和删除操作,无需排序,需包含头文件,支持初始化列表、insert、emplace等操作,可用find、count、at进行查找,支持自定义类型作键但需提供哈希函数。 在C++中,unordered_map 是一个基于哈希…

    2026年5月10日
    000
  • Telegram Bot v20 启动时执行任务与信息获取指南

    本文详细阐述了在 `python-telegram-bot` v20 中,如何在 bot 启动时,即 `run_polling()` 之前,执行自定义逻辑和发送信息。核心在于利用 `post_init_handler` 回调函数,并通过 `application.bot` 实例进行 telegram…

    2026年5月10日
    000
  • sublime中怎么运行html文件路径_sublime运行html文件路径法【指南】

    答案:通过安装插件或配置自定义构建系统,可在Sublime Text中快速用浏览器预览HTML文件。1. 安装Open In Browser插件后右键选择即可打开;2. 创建构建系统并设置对应命令,Windows使用”start chrome $file”,macOS用&#8…

    2026年5月10日
    100
  • Visual Studio Code 中 Python 绘图遇到问题怎么办?

    Visual Studio Code 中的 Python 绘图问题 作为一名 Python 初学者,在 Visual Studio Code 中绘图时遇到了问题?请看这里: 问题一:无法绘制图形 您提供的代码中没有明确的错误,但它可能无法正常工作,因为您没有使用适当的库进行绘图。建议使用 Matpl…

    2026年5月10日
    000
  • python怎么复制文件夹

    在 Python 中复制文件夹有两种方法:使用 shutil.copytree() 函数递归复制文件夹和内容。使用 os 模块创建目标文件夹,遍历源文件夹并复制文件。 如何使用 Python 复制文件夹 在 Python 中复制文件夹非常简单,可以通过以下方法实现: 1. 使用 shutil 模块 …

    2026年5月10日
    000
  • 构建交互式粘性分屏布局:实现滚动内容与固定侧边动态展示

    本教程详细介绍了如何使用CSS构建一个类似Calendly的交互式分屏布局。该布局包含一个可滚动的主内容区域和一个固定在视口侧边的粘性面板。我们将利用Flexbox实现分屏结构,并结合position: sticky属性确保侧边面板在滚动时保持可见。文章还涵盖了布局细节、代码示例及实现动态内容切换的…

    2026年5月10日
    000
  • c++怎么处理Unicode字符串

    c++++处理unicode字符串的方法包括使用std::wstring、std::wstring_convert和第三方库如icu。1) 使用std::wstring存储和输出unicode字符串。2) 通过std::wstring_convert进行编码转换。3) 使用icu库简化unicode…

    2026年5月10日
    000
  • 解决Django中自定义ForeignKey表单字段的必填问题

    本教程旨在解决Django应用中,尽管模型层已将ForeignKey字段设置为可选(blank=True, null=True),但在自定义表单中该字段仍被强制要求填写的问题。核心解决方案是在自定义的forms.ModelChoiceField中明确设置required=False,以确保表单验证与…

    2026年5月10日
    000
  • Go语言中HTTP POST请求头的正确设置:Content-Type的重要性

    本文探讨在go语言中发送http post请求时如何正确添加请求头。通过分析一个常见问题,我们发现`content-type`头对于服务器正确解析请求体至关重要,特别是当发送`application/x-www-form-urlencoded`格式的数据时。文章将提供示例代码,并强调调试网络请求的技…

    2026年5月10日
    000
  • Python Pandas:根据指定分隔符及大写字母规则拆分字符串列

    本文介绍了如何使用 Python Pandas 库,根据包含大写字母的特定分隔符拆分字符串列。我们将探讨使用 str.extract 函数结合正则表达式来实现这一目标,并提供详细的代码示例和解释,帮助你理解和应用这种方法。 在数据处理中,经常会遇到需要根据特定规则拆分字符串列的情况。例如,我们需要根…

    2026年5月10日
    000
  • python中canvas颜色有哪些

    python中canvas颜色有基本颜色、RGB颜色、十六进制颜色和随机颜色。详细介绍:1、基本颜色,如红色、绿色、蓝色、黄色、黑色、白色等,这些颜色可以通过直接使用它们的名称来使用;2、RGB颜色模式是通过红色、绿色和蓝色的组合来创建颜色的一种方式;3、十六进制颜色码是通过在#字符后面跟随6位16…

    2026年5月10日
    000
  • php数据库如何实现增删改查 php数据库基本操作的综合教程

    使用PDO实现PHP数据库操作,需通过预处理语句执行增删改查。1. 连接数据库时设置DSN和异常模式;2. 插入数据使用prepare与execute防止SQL注入;3. 查询用fetchAll或fetch获取结果;4. 更新和删除同样采用预处理绑定参数,确保安全。核心是始终使用预处理机制避免拼接S…

    2026年5月10日
    000
  • c++中decltype关键字的用法 _c++ decltype关键字解析

    decltype 是 C++11 关键字,用于编译时推导表达式类型,包含引用和 const 限定符;其规则分三种情况:标识符或成员访问返回声明类型,加括号的表达式视为左值返回 T&,函数调用或右值返回确切类型但不带引用;常用于模板、泛型编程和尾置返回类型,如 decltype(t + u) …

    2026年5月10日
    000
  • python进程的交流方式

    Python中进程间通信主要有四种方式:1. multiprocessing.Queue支持跨进程安全的数据传递,适用于多生产者消费者场景;2. multiprocessing.Pipe提供双向通信通道,适合两个进程间的点对点高效通信;3. Value和Array通过共享内存实现简单数据类型共享,性…

    2026年5月10日
    000

发表回复

登录后才能评论
关注微信