使用Pydantic和Streamlit回调实现持久化应用状态到JSON

使用pydantic和streamlit回调实现持久化应用状态到json

本教程详细介绍了如何在Streamlit仪表板中实现应用状态的JSON持久化。我们将利用Pydantic定义结构化的应用状态模型,并通过其内置的序列化方法将状态高效地保存为JSON文件。文章还将展示如何结合Streamlit的`on_change`回调机制,在用户交互时自动触发状态保存,并提供从JSON文件加载状态的完整实现,确保仪表板刷新或重访时能无缝恢复之前的工作状态。

引言:Streamlit应用状态持久化的重要性

在开发交互式Streamlit仪表板时,用户对各种参数和行为的调整往往希望在刷新页面或下次访问时得到保留。这种需求催生了应用状态持久化的必要性。虽然Streamlit提供了st.session_state用于管理会话内的状态,但它通常不适用于跨会话或跨重启的持久化。将应用状态保存到外部文件(如JSON)是一种常见且有效的方法,能够确保用户体验的连续性和数据的一致性。

本教程将指导您如何结合Pydantic模型和Streamlit的事件回调机制,优雅地实现应用状态到JSON文件的持久化和加载。

使用Pydantic设计应用状态模型

Pydantic是一个强大的数据验证和设置管理库,非常适合定义结构化的应用状态。通过Pydantic模型,我们可以清晰地定义仪表板中所有需要持久化的参数及其数据类型。

考虑以下示例,它定义了一个包含相机选择、裁剪参数和处理流程配置的复杂应用状态:

import osimport jsonfrom typing import List, Optionalfrom pydantic import BaseModel, Field# 定义状态文件路径STATE_FILE_PATH = "application_state.json"class SelectCameraState(BaseModel):    """相机选择状态模型"""    selected_cameras: List[str] = Field(default_factory=list)class CropState(BaseModel):    """裁剪状态模型"""    crop_type: str = "Anchor"  # Anchor / Fixed    bbox: List[int] = Field(default_factory=lambda: [0, 0, 100, 100]) # x, y, width, height    anchor_class: str = "default_anchor"    anchor_position: List[int] = Field(default_factory=lambda: [50, 50]) # center_x, center_yclass ProcessState(BaseModel):    """处理流程状态模型"""    feature_extractor: str = "ResNet"    embedding_processor: str = "PCA"    outlier_detector: str = "IsolationForest"class ApplicationState(BaseModel):    """整个应用的综合状态模型"""    camera_select_state: SelectCameraState = Field(default_factory=SelectCameraState)    crop_state: CropState = Field(default_factory=CropState)    process_state: ProcessState = Field(default_factory=ProcessState) # 新增处理状态    class Config:        validate_assignment = True # 开启赋值验证

Pydantic模型设计要点:

清晰的结构: 将相关参数分组到独立的子模型中,提高可读性和模块化。默认值: 为所有字段设置合适的默认值,确保首次加载或文件不存在时应用能正常启动。Field(default_factory=…): 对于可变类型(如列表、字典),使用default_factory来提供默认值,避免所有实例共享同一个可变对象。validate_assignment = True: 确保每次对模型实例的赋值操作都会进行验证。

Pydantic模型的序列化与反序列化

Pydantic模型提供了便捷的方法来将实例序列化为JSON字符串,以及从JSON字符串反序列化回模型实例。

序列化到JSON

Pydantic v2+ 版本提供了 model_dump_json() 方法,可以方便地将模型实例转换为JSON字符串。对于Pydantic v1,您可以使用 json() 方法。

# 示例:序列化 ApplicationState 实例app_state_instance = ApplicationState()app_state_instance.camera_select_state.selected_cameras = ["camera_A", "camera_B"]app_state_instance.crop_state.crop_type = "Fixed"# 将模型实例序列化为美观的JSON字符串json_output = app_state_instance.model_dump_json(indent=2)print(json_output)

输出示例:

{  "camera_select_state": {    "selected_cameras": [      "camera_A",      "camera_B"    ]  },  "crop_state": {    "crop_type": "Fixed",    "bbox": [      0,      0,      100,      100    ],    "anchor_class": "default_anchor",    "anchor_position": [      50,      50    ]  },  "process_state": {    "feature_extractor": "ResNet",    "embedding_processor": "PCA",    "outlier_detector": "IsolationForest"  }}

反序列化(加载)JSON到模型

要从JSON字符串或文件加载状态,可以使用Pydantic模型提供的类方法 model_validate_json() (Pydantic v2+) 或 parse_raw() (Pydantic v1)。

# 示例:从JSON字符串反序列化json_string_from_file = """{  "camera_select_state": {    "selected_cameras": [      "camera_X",      "camera_Y"    ]  },  "crop_state": {    "crop_type": "Anchor",    "bbox": [      10,      20,      200,      150    ],    "anchor_class": "custom_anchor",    "anchor_position": [      100,      75    ]  },  "process_state": {    "feature_extractor": "VGG",    "embedding_processor": "TSNE",    "outlier_detector": "DBSCAN"  }}"""# 使用 model_validate_json 从 JSON 字符串创建模型实例loaded_state = ApplicationState.model_validate_json(json_string_from_file)print(loaded_state.camera_select_state.selected_cameras) # 输出: ['camera_X', 'camera_Y']

实现状态的保存与加载函数

为了方便管理,我们将状态的保存和加载逻辑封装成独立的函数。

def save_application_state(state: ApplicationState, file_path: str = STATE_FILE_PATH):    """    将应用状态保存到指定的JSON文件。    """    try:        with open(file_path, "w", encoding="utf-8") as f:            f.write(state.model_dump_json(indent=2))        # st.success(f"状态已保存到 {file_path}") # 在Streamlit应用中可用于反馈    except IOError as e:        # st.error(f"保存状态失败: {e}")        print(f"保存状态失败: {e}") # 命令行输出错误    except Exception as e:        # st.error(f"保存状态时发生未知错误: {e}")        print(f"保存状态时发生未知错误: {e}")def load_application_state(file_path: str = STATE_FILE_PATH) -> ApplicationState:    """    从指定的JSON文件加载应用状态。如果文件不存在或加载失败,则返回一个默认的ApplicationState实例。    """    if not os.path.exists(file_path):        print(f"状态文件 '{file_path}' 不存在,将创建默认状态。")        return ApplicationState()    try:        with open(file_path, "r", encoding="utf-8") as f:            json_data = f.read()        return ApplicationState.model_validate_json(json_data)    except json.JSONDecodeError as e:        print(f"加载状态失败: JSON解析错误 - {e}。将创建默认状态。")        return ApplicationState()    except Exception as e:        print(f"加载状态时发生未知错误: {e}。将创建默认状态。")        return ApplicationState()

注意事项:

错误处理: 在实际应用中,务必添加健壮的错误处理机制,例如文件不存在、JSON格式错误等情况,确保应用不会崩溃。文件编码 使用 encoding=”utf-8″ 确保处理各种字符集。默认状态: 当加载失败或文件不存在时,返回一个默认的 ApplicationState 实例,保证应用始终处于可用状态。

集成到Streamlit:使用on_change回调

Streamlit的on_change回调机制是实现用户交互时自动保存状态的关键。当一个组件的值发生变化时,on_change参数指定的函数会被调用。

我们将使用st.session_state来存储当前的ApplicationState实例,并在组件变化时更新它并触发保存。

import streamlit as stimport osimport jsonfrom typing import List, Optionalfrom pydantic import BaseModel, Field# ... (Pydantic模型定义和save_application_state, load_application_state函数定义同上) ...# 确保 STATE_FILE_PATH 已定义STATE_FILE_PATH = "application_state.json" def update_and_save_state(key: str, new_value):    """    更新st.session_state中的应用状态,并触发保存。    """    # 确保 session_state 中有 app_state    if 'app_state' not in st.session_state:        st.session_state.app_state = load_application_state()    # 根据 key 更新 app_state 的相应部分    # 这里需要根据实际的 Streamlit 控件和 Pydantic 模型结构进行映射    # 示例:如果 key 是 'selected_cameras'    if key == 'selected_cameras':        st.session_state.app_state.camera_select_state.selected_cameras = new_value    elif key == 'crop_type':        st.session_state.app_state.crop_state.crop_type = new_value    elif key == 'feature_extractor':        st.session_state.app_state.process_state.feature_extractor = new_value    # 可以添加更多 elif 来处理其他状态字段    save_application_state(st.session_state.app_state)    st.toast("状态已自动保存!") # 给出用户反馈# --- Streamlit 应用主逻辑 ---st.set_page_config(layout="wide", page_title="Streamlit 状态持久化示例")st.title("Streamlit 应用状态持久化到 JSON 示例")# 1. 初始化或加载应用状态if 'app_state' not in st.session_state:    st.session_state.app_state = load_application_state()    st.success("应用状态已加载。")current_state: ApplicationState = st.session_state.app_state# 2. 构建 Streamlit UI,并绑定 on_change 回调st.header("相机选择")selected_cameras_options = ["Camera_A", "Camera_B", "Camera_C", "Camera_D"]# 使用 st.multiselect 来选择相机selected_cameras = st.multiselect(    "选择要使用的相机:",    options=selected_cameras_options,    default=current_state.camera_select_state.selected_cameras,    key="camera_selector",    on_change=update_and_save_state,    args=('selected_cameras', st.session_state.camera_selector) # 传递 key 和新值)st.header("裁剪设置")crop_type_options = ["Anchor", "Fixed"]crop_type = st.radio(    "选择裁剪类型:",    options=crop_type_options,    index=crop_type_options.index(current_state.crop_state.crop_type),    key="crop_type_selector",    on_change=update_and_save_state,    args=('crop_type', st.session_state.crop_type_selector))st.header("处理流程配置")feature_extractor_options = ["ResNet", "VGG", "EfficientNet"]feature_extractor = st.selectbox(    "选择特征提取器:",    options=feature_extractor_options,    index=feature_extractor_options.index(current_state.process_state.feature_extractor),    key="feature_extractor_selector",    on_change=update_and_save_state,    args=('feature_extractor', st.session_state.feature_extractor_selector))# 3. 显示当前状态(调试用)st.subheader("当前应用状态 (JSON)")st.json(current_state.model_dump())st.markdown("---")st.write("请尝试修改上面的选项,然后刷新页面或关闭再打开应用,查看状态是否被保留。")

关键点说明:

st.session_state 的使用: 我们将 ApplicationState 实例存储在 st.session_state.app_state 中。这是因为Streamlit每次运行脚本时都会重新初始化,st.session_state是跨脚本重新运行保持变量值的唯一方式。on_change 回调: 每个需要持久化的Streamlit组件都应绑定一个on_change回调函数args 参数: on_change回调函数可以通过args参数接收额外的参数。这里我们传递了状态字段的key和组件的当前值(通过st.session_state.获取),以便update_and_save_state函数知道如何更新ApplicationState实例。update_and_save_state 逻辑: 这个函数负责根据传入的key和new_value更新st.session_state.app_state中的对应字段,然后调用save_application_state将整个更新后的状态保存到JSON文件。

总结与最佳实践

通过Pydantic模型和Streamlit的on_change回调,我们实现了一个健壮且易于管理的应用状态持久化方案。

回顾与最佳实践:

Pydantic定义状态: 使用Pydantic模型清晰、结构化地定义所有需要持久化的应用参数。model_dump_json() 和 model_validate_json(): 利用Pydantic提供的内置方法进行高效的JSON序列化和反序列化。封装保存/加载逻辑: 将状态的读写操作封装到独立的函数中,提高代码可维护性。st.session_state 结合: 在Streamlit应用中,使用st.session_state来持有ApplicationState实例,确保在脚本重新运行时状态不会丢失。on_change 回调: 将状态保存函数绑定到Streamlit组件的on_change事件,实现用户交互时的自动保存。错误处理: 在文件操作和JSON解析中加入try-except块,提高应用的鲁棒性。状态文件位置: 考虑将状态文件放置在用户可访问且权限合适的目录,例如用户的主目录或应用数据目录。对于生产环境,可能需要更复杂的存储方案(如数据库、云存储)。性能考量: 对于非常频繁的状态更新或非常大的状态对象,频繁地读写文件可能会影响性能。在这种情况下,可以考虑引入一个延迟保存机制(例如,在用户停止操作几秒后才保存),或者只保存变化的最小子集。

通过遵循这些指导原则,您可以为您的Streamlit仪表板构建一个稳定、用户友好的持久化状态管理系统。

以上就是使用Pydantic和Streamlit回调实现持久化应用状态到JSON的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1379063.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 20:20:27
下一篇 2025年12月14日 20:20:31

相关推荐

  • Odoo中为产品变体界面添加产品模板字段搜索功能指南

    本教程详细指导如何在odoo的产品变体(`product.product`)列表中,通过关联字段实现对产品模板(`product.template`)上自定义字段的搜索功能。文章将涵盖自定义字段定义、关联字段创建,并重点解析在搜索视图中使用`filter_domain`而非`domain`的关键区别…

    2025年12月14日
    000
  • Windows 环境下 Pip 丢失后的快速恢复教程

    本教程旨在指导用户在 windows 操作系统中,当 pip 命令意外丢失或无法识别时,如何无需重新安装 python 即可快速恢复 pip 功能。文章将详细介绍通过 get-pip.py 脚本下载、执行及验证 pip 重新安装的完整步骤,确保您能够顺利恢复 python 包管理器的正常使用,以便继…

    2025年12月14日
    000
  • Odoo QWeb中浮点数到整数的正确转换方法

    %% 通过将t-value替换为t-esc,int(doc.total_mesin_jalan)的计算结果将直接作为标签的文本内容被渲染出来。 注意事项与最佳实践 数据类型转换: QWeb模板支持Python的内置函数,因此可以直接使用int()、str()、float()等进行类型转换。安全性: …

    2025年12月14日
    000
  • 在Python Flask中将在线图片URL转换为Blurhash编码

    本教程详细指导如何在Python Flask应用中,将远程在线图片的URL转换为Blurhash编码。针对官方库主要展示本地文件处理的局限,文章将重点介绍如何通过网络请求获取图片内容,并将其作为文件流传递给Blurhash编码器,从而生成轻量级的图片占位符。 1. Blurhash简介及其优势 Bl…

    2025年12月14日
    000
  • Python日期格式化与健壮输入处理教程

    本教程旨在解决Python程序中处理多种日期输入格式的挑战,特别是如何将“月/日/年”或“月 日, 年”格式的日期统一转换为“YYYY-MM-DD”标准格式。文章将深入探讨使用split()方法的局限性,并重点介绍如何利用Python的re模块(正则表达式)进行高效且健壮的输入格式验证与解析,从而避…

    2025年12月14日
    000
  • 高效使用 ruamel.yaml 保持 YAML 文件格式一致性

    本文深入探讨了如何利用 `ruamel.yaml` 库在 Python 中加载、修改并重新保存 YAML 文件时,精确地保留原始文件的格式细节,包括字符串的引用样式、布尔值的表示方式、文档起始标记以及缩进结构。通过配置 `YAML` 实例的特定属性,开发者可以实现对 YAML 文件的无损往返编辑,确…

    2025年12月14日
    000
  • Windows系统下使用get-pip.py快速恢复Pip的详细教程

    本教程旨在为windows用户提供一个无需重新安装python即可恢复或重新安装pip包管理器的详细指南。当pip命令意外丢失或损坏时,用户可能无法安装python模块。通过利用`get-pip.py`脚本,本教程将引导您完成从下载到验证的整个过程,确保您能在powershell或命令提示符中高效地…

    2025年12月14日
    000
  • Python代码怎么调试_Python代码调试方法与工具使用指南

    调试Python代码需根据项目复杂度选择合适方法:简单脚本可用print语句快速输出状态;02. 内置pdb模块支持断点与单步执行,Python 3.7+推荐使用breakpoint()更简洁;03. IDE如PyCharm、VS Code提供图形化调试界面,便于管理断点与查看变量;04. logg…

    2025年12月14日
    000
  • 理解TensorFlow变量的零初始化与优化器的作用

    在TensorFlow中,`tf.Variable`的初始值(即使是零向量)仅是模型参数的起点。这些参数在模型训练过程中,通过优化器根据定义的损失函数和训练数据进行迭代更新。零初始化本身并不会阻止模型学习,因为优化器的目标是调整这些参数以最小化损失,从而使其从初始的零值演变为能够捕捉数据模式的非零值…

    2025年12月14日
    000
  • 在Python中配置GCP工作负载身份联合凭证:从gcloud命令到SDK实现

    本文旨在提供一份全面的教程,指导开发者如何在Python环境中实现Google Cloud Workload Identity Federation (WIF) 的客户端凭证配置。我们将探讨如何替代`gcloud iam workload-identity-pools create-cred-con…

    2025年12月14日
    000
  • Python日期格式化与输入验证:解决CS50P ‘Outdated’问题

    本文旨在解决python日期处理中遇到的多格式输入验证问题,特别是如何将“月/日/年”或“月 日, 年”格式的日期统一输出为“yyyy-mm-dd”。文章核心内容是利用python的正则表达式(re模块)精确匹配和验证不同日期输入模式,从而提升程序处理用户输入的健壮性与准确性,避免因格式不符导致的重…

    2025年12月14日
    000
  • Odoo产品变体界面添加产品模板字段搜索功能指南

    本教程详细阐述了如何在odoo产品变体(`product.product`)列表中添加一个基于产品模板(`product.template`)自定义字段的搜索功能。通过定义关联字段并正确使用`filter_domain`属性,我们解决了常见的搜索视图配置错误,确保用户能够高效地根据模板层面的信息筛选…

    2025年12月14日
    000
  • Python调用API接口如何分页获取数据_Python调用API接口实现分页查询数据的技巧

    答案:通过页码、偏移量或游标方式循环请求API分页数据,结合响应信息判断是否继续,并添加延迟与重试机制以确保稳定性。 如果您需要从API接口获取大量数据,但响应结果被限制为分页形式,则必须通过循环请求每一页来获取完整数据集。以下是实现分页查询的常用技巧和方法: 一、基于页码的分页获取 许多API使用…

    2025年12月14日
    000
  • Flask SQLAlchemy中防止数据重复插入的策略与实践

    本文旨在探讨在flask应用中使用sqlalchemy将列表数据插入数据库时,如何有效避免数据重复插入的问题。我们将深入分析导致重复的常见原因,并提供两种核心策略:一是利用数据库的唯一性约束进行数据校验与插入,二是采用web开发中的post-redirect-get模式来防止用户意外刷新导致的重复提…

    2025年12月14日
    000
  • GTK3 Python应用中高效管理动态CSS样式指南

    本教程深入探讨了在python gtk3应用中动态管理css样式的有效策略。针对传统单css提供器在运行时难以修改样式且不丢失原有定义的问题,文章提出了两种主要解决方案:一是利用多个css提供器并结合优先级机制实现样式覆盖,二是采用css类进行细粒度控制,通过动态添加和移除类来切换预定义样式。教程通…

    2025年12月14日
    000
  • 使用Python模拟API请求抓取Yahoo Finance历史财报数据

    本教程旨在解决使用python抓取yahoo finance动态加载财报数据的问题。由于yahoo finance的财报页面内容通过javascript动态加载,传统的beautifulsoup直接解析html的方法往往无法获取完整数据。我们将深入探讨如何通过模拟浏览器api请求,直接从yahoo …

    2025年12月14日
    000
  • Wagtail自定义设置的集成与故障排除指南

    本教程详细介绍了如何在wagtail cms中集成自定义设置,并将其注册到后台管理界面。文章将逐步指导您定义设置模型、使用`wagtail.contrib.settings`和`wagtail.contrib.modeladmin`进行注册,并特别指出一个常见陷阱:自定义`construct_set…

    2025年12月14日
    000
  • 解决树莓派4B上OpenCV cv2导入错误的教程

    本文旨在解决树莓派4b上导入`cv2`库时遇到的`importerror: undefined symbol: __atomic_store_8`问题。我们将提供两种解决方案:一种是使用`ld_preload`进行快速临时修复,另一种是涉及通过特定`cmake`标志重新编译opencv的永久性方法。…

    2025年12月14日
    000
  • Python猜谜游戏:优化条件逻辑以实现准确的用户反馈

    本教程深入探讨python猜谜游戏中常见的逻辑陷阱,即如何避免在用户输入正确答案时,程序仍错误地显示“答案错误”的提示。我们将分析原始代码中条件判断的误区,并提供一个经过优化的解决方案。通过精确调整条件语句的执行顺序和结构,确保只有在猜错时才给出错误反馈,从而提升程序的交互准确性和用户体验。 原始代…

    2025年12月14日
    000
  • Python爬虫怎么写_Python网络爬虫编写步骤与实战案例

    答案:编写Python爬虫需先分析网页结构,用requests发送请求获取HTML,再用BeautifulSoup解析提取数据,最后清洗并存储为CSV或数据库;以豆瓣电影Top250为例,通过设置headers、分页爬取、解析class标签获取电影名、评分等信息,保存为CSV文件,并注意遵守robo…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信