使用 Pydantic 进行复杂数据结构的校验

使用 pydantic 进行复杂数据结构的校验

本文将介绍如何使用 Pydantic 在 Python 中校验复杂的嵌套数据结构,特别是包含固定键名和特定类型列表的字典。我们将通过一个 FastAPI 端点示例,展示如何定义 Pydantic 模型来确保输入数据的准确性和一致性。

在构建 API 或处理外部数据时,数据校验是至关重要的一步。Pydantic 是一个强大的 Python 库,它允许我们使用类型提示来定义数据模型,并自动进行数据校验和转换。本文将重点介绍如何使用 Pydantic 校验包含嵌套列表和固定键名的字典结构。

定义 Pydantic 模型

假设我们需要校验如下结构的 JSON 数据:

{  "filters": {    "simple": [["str1", "str2", "str3"], ["str4", "str5", "str6"]],    "combined": [["str7", "str8", "str9"], ["str10", "str11", "str12"]]  }}

其中,filters 字段包含一个字典,字典中包含两个固定的键 simple 和 combined。这两个键对应的值都是一个列表,列表中的每个元素又是一个包含三个字符串的列表。

为了使用 Pydantic 校验这种数据结构,我们需要定义相应的 Pydantic 模型。

首先,我们定义一个 SimpleCombine 模型,它包含 simple 和 combined 两个字段,每个字段都是一个字符串列表的列表,且内部的字符串列表长度必须为 3。

from pydantic import BaseModel, conlistfrom typing import Listclass SimpleCombine(BaseModel):    simple: List[conlist(str, min_length=3, max_length=3)]    combined: List[conlist(str, min_length=3, max_length=3)]

在这里,conlist(str, min_length=3, max_length=3) 表示一个字符串列表,且列表的长度必须在 3 到 3 之间(也就是必须是 3)。

接下来,我们定义一个 Filter 模型,它包含一个 filters 字段,该字段的类型为 SimpleCombine。

class Filter(BaseModel):    filters: SimpleCombine

使用模型进行校验

现在,我们可以使用这些模型来校验数据了。

data = {  "filters": {    "simple": [["str1", "str2", "str3"], ["str4", "str5", "str6"]],    "combined": [["str7", "str8", "str9"], ["str10", "str11", "str12"]]  }}try:    validated_data = Filter(**data)    print("Data is valid:", validated_data)except Exception as e:    print("Data is invalid:", e)

如果数据符合模型定义,Pydantic 将会创建一个 Filter 类的实例,并将数据赋值给相应的字段。如果数据不符合模型定义,Pydantic 将会抛出一个异常,其中包含详细的错误信息。

在 FastAPI 中应用

将 Pydantic 模型应用到 FastAPI 端点中,可以方便地进行请求体的校验。

from fastapi import FastAPIfrom pydantic import BaseModel, conlistfrom typing import Listapp = FastAPI()class SimpleCombine(BaseModel):    simple: List[conlist(str, min_length=3, max_length=3)]    combined: List[conlist(str, min_length=3, max_length=3)]class Filter(BaseModel):    filters: SimpleCombine@app.post("/validate")async def validate_data(filter_data: Filter):    return {"message": "Data is valid", "data": filter_data}

在这个例子中,我们定义了一个 /validate 端点,它接收一个 Filter 类型的请求体。FastAPI 会自动使用 Pydantic 模型来校验请求体,如果请求体不符合模型定义,FastAPI 将会自动返回一个包含错误信息的 HTTP 响应。

注意事项

Pydantic 提供了丰富的校验选项,可以根据实际需求进行配置。例如,可以使用 Field 类来添加更详细的校验规则,如正则表达式、数值范围等。Pydantic 的校验错误信息非常详细,可以帮助开发者快速定位问题。在定义 Pydantic 模型时,尽量使用类型提示,这样可以提高代码的可读性和可维护性。可以利用 Pydantic 的 json_schema() 方法生成 JSON Schema,方便与前端或其他系统进行集成。

总结

本文介绍了如何使用 Pydantic 校验复杂的嵌套数据结构,并将其应用到 FastAPI 端点中。通过定义 Pydantic 模型,我们可以方便地进行数据校验,确保输入数据的准确性和一致性,从而提高应用程序的健壮性和可靠性。Pydantic 提供了强大的类型提示和校验功能,使得数据处理变得更加简单和高效。

以上就是使用 Pydantic 进行复杂数据结构的校验的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1377489.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 17:49:24
下一篇 2025年12月14日 17:49:38

相关推荐

  • 如何为使用 property 工厂创建的类属性添加类型提示

    本文探讨了如何在使用工厂方法动态创建 python 类属性(特别是 property)时,正确地添加类型提示。重点在于解决 `mypy` 和 `pyright` 等类型检查工具将这些属性识别为 `any` 类型的问题,并提供了一种使用泛型 `property` 类来保留类型信息的方法,确保代码的类型…

    好文分享 2025年12月14日
    000
  • Flask 静态资源无法加载到 React 应用的解决方案

    本文针对 Flask 后端无法正确向 React 前端应用提供静态资源(如图片、favicon 等)的问题,提供了一种有效的解决方案。通过调整 Flask 的静态文件配置,将 `static_folder` 指向构建后的 React 应用目录,并设置 `static_url_path` 为空字符串,…

    2025年12月14日
    000
  • Python函数中获取字典键名而非值:参数传递的最佳实践

    本文探讨了在python函数中如何正确地根据字典值返回其对应的键名,而非直接返回值本身。针对尝试对整数使用`.key()`方法导致的`attributeerror`,文章提出了一种健壮的解决方案:将字典键名作为参数传递给函数,并在函数内部利用该键名进行字典查找,从而实现灵活的资源检查和信息返回。 在…

    2025年12月14日
    000
  • 解决AWS CDK Python部署Lambda层导入错误的路径问题

    本文探讨了使用aws cdk python部署lambda层时遇到的导入错误,即使手动上传的相同层文件能正常工作。核心问题在于`_lambda.code.from_asset`方法中层文件路径的指定不准确,误将包含zip文件的目录路径作为了zip文件本身的路径。教程将详细解释该问题,并提供正确的路径…

    2025年12月14日
    000
  • 高效生成BERT词嵌入:解决内存溢出挑战

    本文探讨了在使用bert模型生成词嵌入时常见的内存溢出问题,尤其是在处理长文本或大规模数据集时。我们将介绍如何利用hugging face transformers库进行高效的文本分词和模型前向传播,并强调通过批处理策略进一步优化内存使用,从而稳定地获取高质量的词嵌入。 在使用BERT等大型预训练模…

    2025年12月14日
    000
  • 在Python中以类似JavaScript的方式启动和控制异步协程

    本文旨在解决python异步编程中协程启动和控制的问题,特别是如何实现类似javascript中`async`函数的行为,即立即执行直到遇到第一个`await`。文章将探讨使用`asyncio.run_coroutine_threadsafe`在独立线程中运行协程的方法,并提供示例代码,帮助读者理解…

    2025年12月14日
    000
  • Matplotlib轴刻度高级定制:将绝对数据坐标映射为相对标签

    本教程详细介绍了如何在matplotlib中实现高级轴刻度定制,即使数据点是基于绝对物理坐标绘制的,也能使用更具业务意义的相对标识(如网格编号)来标记轴。通过`set_xticks`、`set_yticks`及其对应的`set_xticklabels`和`set_yticklabels`函数,用户可…

    2025年12月14日
    000
  • 在Flask应用中高效处理GPU密集型后台任务

    本文旨在解决Python Flask服务器在处理GPU密集型任务时出现的阻塞问题。通过深入分析服务器请求处理机制与任务并发执行器的协同工作,文章提供了多种解决方案,包括启用Flask开发服务器的多线程模式、合理使用`ProcessPoolExecutor`或`ThreadPoolExecutor`进…

    2025年12月14日
    000
  • BERT模型长文本词向量生成与内存优化实践

    在使用bert等大型预训练模型生成长文本词向量时,常遇到内存溢出(oom)问题,尤其是在处理大量数据或长序列时。本文提供一套基于hugging face `transformers`库的标准解决方案,通过合理利用`autotokenizer`和`automodel`进行高效分词与模型推理,并重点介绍…

    2025年12月14日
    000
  • Matplotlib教程:在绝对坐标绘图中使用自定义相对轴刻度标签

    本教程旨在解决matplotlib中一个常见的绘图需求:当数据点基于绝对物理坐标(如毫米)绘制时,如何将轴刻度标签替换为更具业务意义的相对标识符(如网格的列/行号)。我们将详细介绍如何利用ax.set_xticks()、ax.set_yticks()、ax.set_xticklabels()和ax.…

    2025年12月14日
    000
  • BERT词嵌入长文本处理与内存优化实践

    本文详细介绍了在使用bert模型生成词嵌入时,如何高效处理长文本并解决内存溢出(oom)问题。教程涵盖了使用hugging face `transformers`库的推荐实践,包括分词器的正确配置、模型前向传播的步骤,并提供了当内存不足时,通过调整批处理大小进行优化的策略,确保在大规模文本数据集上稳…

    2025年12月14日
    000
  • 解决 Visual Studio 2022 中 Python 环境损坏的问题

    本文旨在帮助开发者解决 Visual Studio 2022 中由于错误配置导致的 Python 环境损坏问题。我们将探讨如何排查并修复全局 `PYTHONHOME` 环境变量被错误设置的情况,即使在系统环境变量、注册表和 Visual Studio 设置重置后问题仍然存在。通过详细的步骤和潜在的解…

    2025年12月14日
    000
  • 修复 Visual Studio 2022 中损坏的 Python 环境

    本文档旨在帮助开发者解决 Visual Studio 2022 中 Python 环境因错误配置而损坏的问题。我们将深入探讨导致此问题的常见原因,并提供一系列逐步的解决方案,包括检查系统环境变量、注册表设置、以及 Visual Studio 配置文件等,最终帮助您恢复正常的 Python 开发环境。…

    2025年12月14日
    000
  • python中如何遍历目录树

    最常用方法是os.walk()和pathlib。os.walk()递归遍历目录,返回(路径,子目录,文件)三元组;pathlib的rglob()更简洁,适合现代Python项目。 在Python中遍历目录树,最常用的方法是使用 os.walk()。它能递归地遍历指定目录下的所有子目录和文件,返回一个…

    2025年12月14日
    000
  • python怎么调用c函数

    Python调用C函数主要通过ctypes、cffi或C扩展模块实现。最常用的是ctypes,作为内置库无需额外依赖,适合初学者和大多数场景。首先将C代码编译为共享库(如Linux下生成.so,Windows下生成.dll),然后在Python中使用ctypes加载该库并声明函数原型,最后直接调用函…

    2025年12月14日
    000
  • Flask应用中异步执行GPU密集型任务的策略

    本文旨在指导如何在Flask应用中有效地将耗时的GPU密集型任务转移到后台执行,确保Web服务器的响应性和客户端的非阻塞体验。我们将探讨`concurrent.futures`模块与Flask开发服务器的结合使用,以及生产环境下WSGI服务器的配置,并提供替代的服务器架构方案,以实现任务的异步处理和…

    2025年12月14日
    000
  • Python多CSV文件数据处理与Matplotlib可视化教程

    本教程旨在解决python处理多个csv文件时常见的语法错误、文件路径管理问题以及matplotlib绘图的实践技巧。我们将重点讲解如何正确导入、处理指定目录下的所有csv文件,并利用matplotlib为每个文件生成独立的彩色图表,同时提供代码优化建议和注意事项,确保流程的健壮性和可读性。 在数据…

    2025年12月14日
    000
  • 解决KeyBERT安装中的Rust/Cargo依赖问题

    本文旨在解决keybert库在python环境中安装时遇到的常见rust/cargo编译依赖问题。当尝试通过pip安装keybert时,如果系统缺少rust编译器和cargo包管理器,会导致安装失败。本教程将详细指导用户如何安装rust工具链,从而成功安装并使用keybert。 理解KeyBERT的…

    2025年12月14日
    000
  • SharePoint程序化访问:解决AADSTS65001错误与证书认证实践

    本文旨在解决在使用`office365-rest-python-client`库程序化访问sharepoint online时,即使已授予api权限并进行管理员同意,仍可能遇到的`aadsts65001 delegationdoesnotexist`认证错误。核心解决方案是放弃客户端密钥(clien…

    2025年12月14日
    000
  • Plotly图表生成HTML字符串的正确方法与优化实践

    本文旨在纠正plotly图表导出html字符串的常见误区,明确指出应使用`fig.to_html()`而非`fig.write_html()`来获取html字符串。同时,文章将深入探讨如何通过配置`include_plotlyjs`参数来显著优化生成html字符串的大小,这对于将plotly图表集成…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信