使用Python,Pydantic和Langchain创建可维护的AI工作流程

使用python,pydantic和langchain创建可维护的ai工作流程

概述与核心概念

本教程演示如何利用Python和Pydantic构建易于维护的AI工作流。我们将重点创建一个可轻松修改和扩展的故事分析系统。

Pydantic模型是现代Python应用中类型安全数据处理的基石。它们允许我们定义数据的结构并自动验证数据,这在AI工作流中至关重要,因为它有助于保持一致性并在早期发现错误。

Pydantic模型是继承自BaseModel并定义数据预期结构的类。模型中的每个字段都可以带有类型提示,Pydantic用于验证。

立即学习“Python免费学习笔记(深入)”;

构建故事分析系统

让我们构建一个简单的故事分析系统来实践这些概念。

你需要安装以下包:

pip install pydantic langchain-openai

模型定义

from pydantic import BaseModelfrom typing import Listclass Story(BaseModel):    title: str    content: str    genre: str = "unknown"class StoryForChildren(Story):    """    专为儿童设计的童话故事。    适合2-6岁的儿童。    """    passclass StoryForBabies(Story):    """    专为婴儿设计的童话故事。    适合0-2岁的婴儿和幼儿。    特点:    - 简洁、重复的语言    - 基本概念    - 短句    - 富有感官体验的描述    """    passclass StoryAnalysis(BaseModel):    # 人物元素    character_names: List[str]    character_descriptions: List[str]    # 主题元素    main_theme: str    supporting_themes: List[str]    symbols: List[str]    # 情节元素    exposition: str    climax: str    resolution: str    key_events: List[str]    # 风格和解读    writing_techniques: List[str]    overall_interpretation: str

此模型定义了具有标题、内容和可选类型字段的故事的基本结构。请注意,AI将使用模型的文档字符串来生成正确的输出。通常,如果变量命名正确,LLM可以理解提示,但在某些情况下(例如儿童故事),我们需要明确告诉LLM我们想要什么。这是通过添加文档字符串(仅在class StoryForChildren(Story):下方)来实现的。

创建AI代理

我们创建一个专门的代理,可以在定义的模型之间转换内容。使用get_agent_function函数。

该函数接收输入模型、输出模型和温度参数。它返回一个新函数,可用于转换数据。

from langchain.chat_models import ChatOpenAIfrom typing import Union, Callablefrom pydantic import BaseModel, ValidationErrordef get_agent_function(    input_model: Union[BaseModel, str],    output_model: BaseModel,    temperature: float = 0.3) -> Callable[[Union[str, BaseModel]], BaseModel]:    llm = ChatOpenAI(        model="gpt-4",        temperature=temperature    )    def run_llm(input_data: Union[str, BaseModel]) -> BaseModel:        try:            if isinstance(input_data, BaseModel):                input_data = input_data.model_dump_json()            llm_with_output = llm.with_structured_output(output_model)            response = llm_with_output.invoke(input_data)            return response        except ValidationError as e:            print(f"Validation Error: {e}")            return None  # or handle the error appropriately    return run_llm

使用工作流

以下是模型和代理的协同使用方法:

# 创建专用代理parse_story = get_agent_function(str, Story)get_baby_friendly_story = get_agent_function(Story, StoryForBabies)analyze_story = get_agent_function(Story, StoryAnalysis)# 执行工作流story_text = "这是一个关于勇敢的小兔子的故事..." # 替换为你的故事文本story = parse_story(story_text)baby_friendly_story = get_baby_friendly_story(story)analysis = analyze_story(baby_friendly_story)print(analysis)

关键优势

内置LLM提示: Pydantic模型中的文档字符串是LLM的直接提示。通过更新模型的文档字符串,我们自动更新LLM解释和生成内容的方式。

单一数据源: Pydantic模型既作为文档,也作为功能代码,而不是维护单独的提示和数据结构。当需要更改AI行为时,只需更新模型的文档字符串;当需要更改数据结构时,只需更新模型字段。这消除了提示和代码不同步的常见问题。

类型安全和验证: Pydantic自动验证所有流经AI工作流的数据。如果LLM生成无效输出,你将立即知道。这有助于在开发过程的早期发现错误。

自文档化架构: 模型清晰地显示了你的数据结构和AI的预期行为。新团队成员可以通过阅读模型来理解整个工作流。

练习

复制此代码,尝试创建一个名为StoryForTeenagers的新故事类型,并修改工作流以生成适合青少年年龄的内容。考虑哪些特定领域或验证规则可能与该受众相关。

以上就是使用Python,Pydantic和Langchain创建可维护的AI工作流程的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1356052.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 19:35:54
下一篇 2025年12月13日 19:36:09

相关推荐

  • pytorch中的随机溶剂(1)

    this text discusses the randomresizedcrop function from the torchvision.transforms.v2 library in python, demonstrating its use with the oxford iiit pe…

    2025年12月13日 好文分享
    000
  • 为什么WebAssembly(WASM)是高性能Web应用程序的未来

    webassembly (wasm):高性能web应用的未来 Web技术日新月异,从静态HTML页面发展到如今高度互动且复杂的应用。然而,传统的基于JavaScript的Web应用在处理高性能任务时常常力不从心。这时,WebAssembly (Wasm)应运而生,它以接近原生应用的速度在浏览器中运行…

    2025年12月13日
    000
  • 使用Python和简化的库存基本分析

    利用Python和简化方法进行高效的基本面股票分析,在瞬息万变的股票市场中占据优势。本文将深入探讨如何运用Python及自定义模块(例如yfinance3)构建自动化工具,实现股票基本面分析。我们将逐步拆解代码,并阐明每个部分如何有效地收集和处理股票数据。 项目核心功能: 从CSV文件加载和处理多个…

    2025年12月13日
    000
  • 第二天 – 句子,订购,子查询,汇总函数,在数据库中组。

    员工信息表: empid | empname | designation | dept | salary ——-+———+——————-+———–+——– 11 | lakshmi | 软件工程师 | IT | 50000 12 |…

    2025年12月13日
    000
  • 使用OpenAi的食品识别和营养估算

    这是您可以在短短20分钟内使用openai构建简单的食物识别和营养估算应用程序的方法它的工作原理 >图像编码:图像被转换为​​base64格式,以通过openai的api处理。 >食物识别提示:该应用将图像发送到openai,以识别食物及其各自的数量。 营养估计:使用另一个提示来估计基于…

    好文分享 2025年12月13日
    000
  • 使用Zappa在AWS lambda + API网关上部署数字分类API

    概述 这个项目是一个基于烧瓶的api,可提供给定数字的有趣数学属性。它确定一个数字是素数,完美还是一个阿姆斯特朗的数字,还提供了数字的总和和一个有趣的事实。 > > zappa使在aws lambda api网关上构建和部署无服务器驱动的python应用程序(包括但不限于wsgi web…

    2025年12月13日 好文分享
    000
  • OpenAI工具呼叫示例

    from json import loadsfrom signal import signal, sigintfrom requests import get # pip install requestsfrom openai import openai # pip install openai# …

    好文分享 2025年12月13日
    000
  • 从零到fastapi英雄:我的hngstage dventure

    从零构建FastAPI应用:我的HNG Stage 0 项目实战 各位后端开发者们,大家好! 本文记录了我完成HNG Stage 0 项目的历程,一个使用FastAPI构建的简单API。这个API实现了三个功能:返回我的注册邮箱、显示当前UTC时间(ISO 8601格式)以及提供项目GitHub仓库…

    2025年12月13日
    000
  • 算法和伪代码简介

    算法概述 算法是什么? 算法是解决问题或完成任务的一系列步骤。 你可以把它想象成一个烹饪食谱: 输入:食材(例如,数据,用户需求)步骤:混合、烘焙(例如,计算、比较)输出:最终菜肴(例如,排序列表,最短路径) 例如,GPS应用使用算法来查找最快路线,它会考虑交通状况、道路封闭情况和距离等因素。 有效…

    2025年12月13日
    000
  • 将布鲁斯基帖子转换为Pixela图的工具

    我创建了一个工具,将我的每日bluesky帖子数量可视化到pixela图表中。源代码已上传至github。 我的帐户图表如下所示: 如您所见,我的Bluesky发帖习惯呈现出明显的间歇性,通常只在有空闲时间时才会发帖。此工具有助于直观地展现这一模式。 工作原理 该工具通过Bluesky API 每日…

    2025年12月13日
    000
  • 如何使用编码代理添加自动单位测试

    利用AI编码代理gitauto自动生成单元测试 单元测试的重要性毋庸置疑,但繁重的开发任务常常使它被搁置。 本文介绍如何利用AI编码代理gitauto,将单元测试的编写自动化,从而提升代码质量,同时不影响主要开发进度。 挑战与初次尝试 以services/github/branch_manager.…

    2025年12月13日
    000
  • 构建我的第一个Python终端游戏:Hangman

    最近,我完成了Codecademy计算机科学101课程中的一个Python项目:一个简单的Hangman(猜字游戏)。虽然是入门级项目,但它让我很好地练习了代码构建、用户输入处理和游戏逻辑管理。游戏规则遵循经典Hangman:程序从预定义词库中随机选择一个单词;玩家逐个猜测字母;猜对则显示字母;猜错…

    2025年12月13日
    000
  • 掌握数据争吵:开发人员的简单指南

    引言 数据争吵是将原始数据转化为可分析的、有价值信息的过程。它包含数据清洗、结构化和增强等步骤,为后续分析奠定坚实基础。 什么是数据争吵? 数据争吵,也称数据清洗或数据准备,是指将原始数据转换为结构化格式的过程。它主要包括以下几个方面: 数据清洗: 清除数据集中的重复项、处理缺失值并纠正错误。数据转…

    2025年12月13日
    000
  • 编号分类API开发HNG任务1

    数字分类API:一个DevOps实践项目 本项目旨在提供一个简单易用的数字数学属性查询接口。该数字分类api接受整数作为输入,返回包含关键属性和趣味事实的结构化json响应。 项目涵盖了软件开发生命周期(sdlc)的各个阶段,从开发和测试到部署和监控,为理解devops实践的集成提供了一个端到端的学…

    2025年12月13日
    000
  • 探索ASGI:Python的Web应用程序异步协议

    LeapCell:Python Web 托管、异步任务和 Redis 的最佳无服务器平台 本文探讨 Python Web 应用中 ASGI 协议与 Uvicorn 服务器的关系。 初学者常疑惑为何 FastAPI 开发需要 Uvicorn,本文将解答此疑问。 Uvicorn 的作用 以下是一个简单的…

    2025年12月13日
    000
  • AWS lambda ric-运行时接口客户端

    为何选择 Lambda RIC? Lambda RIC 提供诸多优势,尤其在处理大型部署方面: Docker 镜像支持更大规模部署 (最大 10GB): 非常适合包含大量资源,例如 OPA 策略、大型代码库 (而非简单的 zip 文件),并能实现更有效的资源管理。 其优化的层管理和缓存机制进一步提升…

    2025年12月13日
    000
  • &#使用seleniumbase

    >我当前正在使用seleniumbase进行python中的web自动化,但是,有时我会收到“未创建的会话”错误:> test16.py – selenium.common.exceptions.sessionnotcreatedexception: message: session n…

    好文分享 2025年12月13日
    000
  • Python Day-抽象,封装

    抽象: – >抽象用于隐藏用户的内部功能。 – >用户仅与该函数的基本实现进行交互,但内部工作已隐藏。 ->用户熟悉“函数的作用”,但他们不知道“它的作用”。->抽象是使用摘要类和摘要方法实现的,abc(抽象基类)模块提供。 > 一个抽象类是无法…

    2025年12月13日
    000
  • Pytorch中的BanderverticalFlip

    给我买咖啡☕ *备忘录: 我的帖子说明randomhorizo​​ntalflip()。我的帖子解释了牛津iiitpet()。*备忘录: 初始化的第一个参数是p(可选默认:0.5-type:int或float):*备忘录:这是图像是否被翻转的可能性。>必须为0 第一个参数是img(必需类型:p…

    2025年12月13日 好文分享
    000
  • GitLab入门:登录指南和初学者提示

    GitLab快速入门:登录及实用技巧 GitLab是一个功能强大的DevOps平台,提供Git仓库管理、CI/CD管道、问题追踪等多种功能,是开发者版本控制和项目协作的理想选择。本文将指导您快速登录GitLab并提供一些初学者实用技巧。 GitLab登录步骤: 访问GitLab网站: 打开官方Git…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信