使用 PostgreSQL 和 SQLAlchemy 查询嵌套 JSONB 列

使用 postgresql 和 sqlalchemy 查询嵌套 jsonb 列

本文介绍了如何在 PostgreSQL 数据库中,使用 SQLAlchemy 和 Python 查询包含深度嵌套对象的 JSONB 列。我们将探讨如何使用 jsonb_path_query 函数以及 JSONPath 表达式来高效地检索所需数据,并解决常见的语法错误。通过本文,你将掌握一种更灵活、强大的 JSONB 数据查询方法。

理解 JSONB 和 JSONPath

PostgreSQL 的 JSONB 数据类型允许你存储 JSON(JavaScript Object Notation)数据,并对其进行高效的查询。JSONPath 是一种查询 JSON 数据的语言,类似于 XPath 用于 XML 数据。

在处理嵌套的 JSONB 对象时,直接访问深层嵌套的数据可能比较困难。这时,jsonb_path_query 函数结合 JSONPath 表达式就显得非常强大。

使用 jsonb_path_query 查询嵌套对象

假设我们有一个名为 private_notion 的表,其中包含一个名为 record_map 的 JSONB 列,该列存储了嵌套的 JSON 对象。我们的目标是根据特定的键(例如 UUID)在 record_map 中查找对象。

以下是一个示例 JSON 结构:

{  "blocks": {    "7a9abf0d-a066-4466-a565-4e6d7a960a37": {      "name": "block1",      "value": 1,      "child": {        "7a9abf0d-a066-4466-a565-4e6d7a960a37": {          "name": "block2",          "value": 2,          "child": {            "7a9abf0d-a066-4466-a565-4e6d7a960a37": {              "name": "block3",              "value": 3            }          }        },        "7a9abf0d-a066-4466-a565-4e6d7a960a38": {          "name": "block4",          "value": 4,          "child": {            "7a9abf0d-a066-4466-4466-a565-4e6d7a960a39": {              "name": "block5",              "value": 5,              "child": {                "7a9abf0d-a066-4466-a565-4e6d7a960a40": {                  "name": "block6",                  "value": 6                }              }            }          }        }      }    }  }}

要查找包含特定 UUID 的对象,可以使用以下 SQL 查询:

SELECT jsonb_path_query(record_map,                         'strict $.**?(@.keyvalue().key==$target_id)',                        jsonb_build_object('target_id',                                           '7a9abf0d-a066-4466-a565-4e6d7a960a37'))FROM private_notionWHERE site_id = '45bf37be-ca0a-45eb-838b-015c7a89d47b';

这个查询使用了 jsonb_path_query 函数,并传入了以下参数:

record_map: 要查询的 JSONB 列。’strict $.**?(@.keyvalue().key==$target_id)’: JSONPath 表达式,用于递归搜索 JSON 对象,查找键等于 $target_id 的对象。strict 模式确保了表达式的严格匹配。jsonb_build_object(‘target_id’, ‘7a9abf0d-a066-4466-a565-4e6d7a960a37’): 创建一个 JSON 对象,将 target_id 设置为要查找的 UUID。

在 SQLAlchemy 中使用 jsonb_path_query

在 SQLAlchemy 中,可以使用 text 方法执行原始 SQL 查询。以下是一个示例:

from sqlalchemy import textfrom sqlalchemy.ext.asyncio import AsyncSessionasync def get_private_notion_page(    site_uuid: str, page_id: str, db_session: AsyncSession) -> dict:    """    Retrieves a nested object from a JSONB column by key using jsonb_path_query.    """    query = text(        """        SELECT jsonb_path_query(record_map,                                 'strict $.**?(@.keyvalue().key==$target_id)',                                jsonb_build_object('target_id', :page_id))        FROM private_notion        WHERE site_id = :site_uuid        """    )    result = await db_session.execute(query, {"page_id": page_id, "site_uuid": site_uuid})    result = result.scalars().first()    return result

在这个例子中,我们使用了参数化查询,将 page_id 和 site_uuid 作为参数传递给查询,避免了 SQL 注入的风险。

常见错误和解决方法

在尝试使用 jsonb_path_query 时,可能会遇到一些常见的错误。以下是一些解决方法:

语法错误: 确保 JSONPath 表达式使用单引号括起来。UUID 格式错误: 确保 UUID 在 JSONPath 表达式中用双引号括起来。未启用 strict 模式: 建议在使用 .** 访问器时,始终启用 strict 模式,以避免意外的结果。

使用 SQLAlchemy JSONPath 类型

从 SQLAlchemy 2.0 开始,你可以使用 JSONPath 类型来更安全地传递 JSONPath 表达式。

from sqlalchemy.dialects.postgresql import JSONPathfrom sqlalchemy import column, table, selectprivate_notion_table = table(    "private_notion",    column("record_map"),    column("site_id"),)def get_private_notion_page(site_uuid: str, page_id: str):    """    Retrieves a nested object from a JSONB column by key using jsonb_path_query and SQLAlchemy JSONPath.    """    target_id = "7a9abf0d-a066-4466-a565-4e6d7a960a37"    jsonpath_expression = "strict $.**?(@.keyvalue().key==$target_id)"    stmt = select(        func.jsonb_path_query(            private_notion_table.c.record_map,            jsonpath_expression,            func.jsonb_build_object("target_id", target_id),        )    ).where(private_notion_table.c.site_id == site_uuid)    # Execute the statement using your database session    # result = await db_session.execute(stmt)    # return result.scalars().first()    return stmt  # Returning the statement for demonstration

总结

通过本文,你学习了如何使用 PostgreSQL 的 jsonb_path_query 函数和 JSONPath 表达式,结合 SQLAlchemy,高效地查询嵌套的 JSONB 数据。 掌握这些技术,可以让你更灵活地处理 JSONB 数据,并构建更强大的应用程序。记住,正确地使用 JSONPath 表达式,并注意常见的错误,是成功查询 JSONB 数据的关键。

以上就是使用 PostgreSQL 和 SQLAlchemy 查询嵌套 JSONB 列的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1374466.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 14:10:45
下一篇 2025年12月14日 14:10:52

相关推荐

  • 扩展 Django User 模型:添加自定义字段

    本文介绍如何在 Django 中扩展默认的 User 模型,无需使用一对一关联,直接添加自定义的布尔字段和选择字段。通过创建自定义 User 模型并配置 AUTH_USER_MODEL,可以轻松地在用户注册和管理界面中集成新的字段,并进行数据库迁移,从而满足特定业务需求。 扩展 Django Use…

    2025年12月14日
    000
  • 计算嵌套列表中跨子列表的重复元素之和

    本文旨在提供一种高效且准确的方法,用于计算嵌套列表中跨多个子列表出现的重复元素之和。传统方法可能涉及扁平化列表和统计元素出现次数,但这种方法效率较低。本文介绍一种利用字典和集合的优化方案,能够更有效地处理嵌套列表中的重复元素,并提供相应的Python代码示例和详细解释。 问题描述 给定一个嵌套列表,…

    2025年12月14日
    000
  • 利用谱分量变换数组:原理、实现与注意事项

    本文旨在指导读者如何利用数组的谱分量进行变换。我们将首先解释谱分解的基本概念,然后通过一个具体的例子,展示如何计算数组的拉普拉斯矩阵、特征值和特征向量,并利用这些特征向量进行谱分解和重构。最后,我们将讨论一些常见问题和注意事项,帮助读者更好地理解和应用这一技术。 谱分解与数组变换 谱分解是一种将矩阵…

    2025年12月14日
    000
  • 利用谱分量转换数组:Python实现与注意事项

    本文旨在指导读者如何利用数组的谱分量进行转换。通过计算数组的拉普拉斯矩阵的特征值和特征向量,提取其谱分量,并利用这些分量重构数组。本文将详细介绍使用numpy库实现这一过程的步骤,并强调特征向量正交性的重要性,以及如何正确计算特征向量的内积。 谱分解与数组转换 谱分解是一种将矩阵分解为其特征值和特征…

    2025年12月14日
    000
  • python线程阻塞的解决

    使用多线程或异步编程可避免Python中因I/O、锁竞争等导致的线程阻塞。通过threading模块将耗时任务放入子线程,结合队列实现安全通信;对I/O密集型任务采用asyncio异步编程更高效。示例:创建子线程执行long_task,主线程继续运行。设置超时机制,如网络请求timeout、锁acq…

    2025年12月14日
    000
  • 使用 Python Socket 模块实现跨设备通信

    本文档旨在解决 Python Socket 编程中,服务器端绑定本地环回地址(127.0.0.1)导致客户端无法通过公网 IP 连接的问题。通过修改服务器端绑定的 IP 地址为机器的本地 IP 地址,并确保客户端连接服务器的公网 IP 地址,实现跨设备通信。同时,需要注意防火墙设置和端口转发配置,以…

    2025年12月14日
    000
  • 使用 Python Socket 模块构建跨设备网络应用:连接本地与公网

    本文档旨在解决 Python Socket 编程中,服务器在本地运行但客户端无法通过公网 IP 连接的问题。通过修改服务器绑定地址和客户端连接地址,实现跨设备的网络通信。文章将提供详细的配置步骤和代码示例,帮助开发者理解和解决类似的网络连接问题。 理解 Socket 连接中的 IP 地址 在构建网络…

    2025年12月14日
    000
  • 扩展 Django User 模型:自定义字段添加及管理

    本文介绍了如何在 Django 中扩展默认的 User 模型,通过创建自定义用户模型并添加额外的布尔字段和选择字段,无需使用一对一字段关联到其他模型。同时,本文还阐述了如何将自定义字段集成到 Django Admin 后台进行管理,提供完整的代码示例和操作步骤,帮助开发者更好地定制用户模型。 自定义…

    2025年12月14日
    000
  • 使用 Python Socket 模块构建跨设备 Server 的正确姿势

    本文旨在帮助开发者解决在使用 Python socket 模块构建服务器时,无法通过不同网络设备连接的问题。文章将详细讲解如何正确配置服务器的绑定地址,以及客户端的连接地址,确保跨设备通信的顺利进行。通过本文,读者将能够避免常见的网络配置错误,成功搭建可供外部访问的 Python 服务器。 在使用 …

    2025年12月14日
    000
  • 使用 SQLAlchemy 和 PostgreSQL 过滤 JSON 类型字段

    摘要:本文档介绍了如何使用 SQLAlchemy 和 PostgreSQL 过滤 JSON 类型字段中的数据。我们将探讨如何使用 cast() 函数将 JSON 类型转换为 JSONB 类型,并利用 has_any() 方法来高效地筛选出包含特定数组元素的记录。此外,还讨论了 JSONPath 的使…

    2025年12月14日
    000
  • 使用 unittest.mock.patch 修改类属性以返回原始值的修改版本

    本文介绍了如何使用 unittest.mock.patch 动态修改类属性,使其返回基于原始属性值的修改后的结果。通过自定义描述符类,我们可以拦截属性的访问,并在返回之前对其进行修改,从而实现对类属性的灵活控制和定制。本文将提供详细的代码示例和解释,帮助读者理解和应用这种技术。 在单元测试或需要动态…

    2025年12月14日
    000
  • 深入理解配置合并:从多个配置文件中选择性提取配置项

    本文旨在解决在配置管理中,如何从多个独立的配置文件中选择性地提取特定配置项进行合并的问题。通过引入命名默认值(Named Defaults)和值插值(Value Interpolation)机制,我们将演示一种灵活且强大的方法,允许用户精确控制配置的组合方式,从而实现模块化和可复用的配置管理。 1.…

    2025年12月14日
    000
  • Python Pandas:高效合并多工作簿多工作表 Excel 数据

    本教程详细指导如何使用 Python Pandas 库高效合并来自多个 Excel 文件中指定工作表的数据。文章将解释如何遍历文件目录、正确加载 Excel 文件、识别并解析特定工作表,并将来自不同文件的同名工作表数据智能地整合到一个 Pandas DataFrame 字典中,同时提供完整的示例代码…

    2025年12月14日
    000
  • Django 后端权限管理与前端视图控制:基于 Group 的最佳实践

    在构建 Django 后端与 Vue 前端应用时,如何高效地将用户权限信息同步至前端以实现视图控制是一个常见挑战。本文将探讨不同的权限数据传输策略,并强烈推荐利用 Django 内置的 Group 系统来管理和暴露用户权限,以实现灵活、可扩展且易于维护的权限控制方案,避免自定义角色字段或混合使用带来…

    2025年12月14日
    000
  • Langchain LCEL 链式调用:激活详细输出与调试指南

    本教程详细介绍了在Langchain使用LCEL构建链式调用时,如何获取并配置详细的中间步骤输出。通过引入回调处理器(如ConsoleCallbackHandler),用户可以观察链的内部执行流程,从而有效进行调试。文章还探讨了全局调试模式以及针对特定组件的配置方法,并提及了可视化调试工具。 在使用…

    2025年12月14日
    000
  • 解决PyTorch深度学习模型验证阶段CUDA内存不足(OOM)错误

    本教程旨在深入探讨PyTorch深度学习模型在验证阶段出现“CUDA out of memory”错误的常见原因及解决方案。重点关注训练阶段正常而验证阶段报错的特殊情况,提供包括GPU内存监控、显存缓存清理、数据加载优化及代码调整等一系列实用策略,帮助开发者有效诊断并解决显存溢出问题,确保模型顺利完…

    2025年12月14日
    000
  • 解决PyTorch深度学习模型验证阶段CUDA内存不足错误

    在PyTorch深度学习模型验证阶段,即使训练过程顺利,也可能遭遇CUDA out of memory错误。本文旨在深入分析此问题,并提供一系列实用的解决方案,包括利用torch.cuda.empty_cache()清理GPU缓存、监控GPU内存占用、以及优化数据加载与模型处理策略,帮助开发者有效管…

    2025年12月14日
    000
  • Python colorspace 库安装指南:规避常见错误与正确实践

    本教程旨在解决 python-colorspace 库安装时遇到的常见问题,特别是 No matching distribution found 错误。由于该库尚未发布至 PyPI,直接使用 pip install 会失败。文章将详细介绍官方推荐的安装方法,包括通过 Git 仓库安装和直接从 Git…

    2025年12月14日
    000
  • Pandas:高效整合多工作表Excel数据教程

    本教程详细介绍了如何使用Python的Pandas库高效地处理和整合来自多个Excel文件中的特定工作表数据。我们将学习如何遍历目录、识别Excel文件、加载文件、提取指定工作表的数据并将其存储到一个字典中,同时解决常见的AttributeError: ‘str’ objec…

    2025年12月14日
    000
  • 使用Pandas高效合并多Excel文件中的指定工作表数据

    本教程详细介绍了如何利用Python的Pandas库合并多个Excel文件中的特定工作表数据。我们将学习如何遍历文件目录、识别Excel文件、加载多工作簿文件、根据工作表名称筛选数据,并将选定的工作表内容存储到Python字典中,最终形成结构化的DataFrame集合,同时会指出并解决常见的Attr…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信