如何使用 Ollama 和 LangChain 创建本地 RAG 代理

如何使用 ollama 和 langchain 创建本地 rag 代理

什么是 rag?

rag 代表检索增强生成,这是一种强大的技术,旨在通过以文档形式为大型语言模型(llm)提供特定的相关上下文来增强其性能。与纯粹根据预先训练的知识生成响应的传统法学硕士不同,rag 允许您通过检索和利用实时数据或特定领域的信息,使模型的输出与您期望的结果更紧密地结合起来。

rag 与微调

虽然 rag 和微调的目的都是提高 llm 的性能,但 rag 通常是一种更高效且资源友好的方法。微调涉及在专门的数据集上重新训练模型,这需要大量的计算资源、时间和专业知识。另一方面,rag 动态检索相关信息并将其合并到生成过程中,从而可以更灵活且更具成本效益地适应新任务,而无需进行大量的再培训。

构建 rag 代理

安装要求

安装奥拉马

ollama 提供本地运行 llama 所需的后端基础设施。首先,请访问 ollama 的网站并下载该应用程序。按照说明在本地计算机上进行设置。

安装 langchain 要求

langchain 是一个 python 框架,旨在与各种 llm 和向量数据库配合使用,使其成为构建 rag 代理的理想选择。通过运行以下命令安装 langchain 及其依赖项:

pip install langchain

对 rag 代理进行编码

创建 api 函数

首先,您需要一个函数来与本地 llama 实例交互。设置方法如下:

from requests import post as rpostdef call_llama(prompt):    headers = {"content-type": "application/json"}    payload = {        "model": "llama3.1",        "prompt": prompt,        "stream": false,    }    response = rpost(        "http://localhost:11434/api/generate",        headers=headers,        json=payload    )    return response.json()["response"]

创建 langchain llm

接下来,将此功能集成到langchain内的自定义llm类中:

from langchain_core.language_models.llms import llmclass llama(llm):    def _call(self, prompt, **kwargs):        return call_llama(prompt)    @property    def _llm_type(self):        return "llama-3.1-8b"

集成 rag 代理

设置检索器

检索器负责根据用户的查询获取相关文档。以下是如何使用 faiss 进行矢量存储和 huggingface 的预训练嵌入进行设置:

from langchain.vectorstores import faissfrom langchain_huggingface import huggingfaceembeddingsdocuments = [    {"content": "what is your return policy? ..."},    {"content": "how long does shipping take? ..."},    # add more documents as needed]texts = [doc["content"] for doc in documents]retriever = faiss.from_texts(    texts,    huggingfaceembeddings(model_name="all-minilm-l6-v2")).as_retriever(k=5)

创建提示模板

定义 rag 代理将用于根据检索到的文档生成响应的提示模板:

from langchain.prompts import chatprompttemplate, messagesplaceholderfaq_template = """you are a chat agent for my e-commerce company. as a chat agent, it is your duty to help the human with their inquiry and make them a happy customer.help them, using the following context:{context}"""faq_prompt = chatprompttemplate.from_messages([    ("system", faq_template),    messagesplaceholder("messages")])

创建文档和检索器链

将文档检索和 llama 生成结合成一个内聚链:

from langchain.chains.combine_documents import create_stuff_documents_chaindocument_chain = create_stuff_documents_chain(llama(), faq_prompt)def parse_retriever_input(params):    return params["messages"][-1].contentretrieval_chain = runnablepassthrough.assign(    context=parse_retriever_input | retriever).assign(answer=document_chain)

启动您的 ollama 服务器

运行 rag 代理之前,请确保 ollama 服务器已启动并正在运行。使用以下命令启动服务器:

ollama serve

提示您的 rag 代理

现在,您可以通过发送查询来测试您的 rag 代理:

from langchain.schema import HumanMessageresponse = retrieval_chain.invoke({    "messages": [        HumanMessage("I received a damaged item. I want my money back.")    ]})print(response)

回复:
“得知您收到损坏的物品,我感到非常遗憾。根据我们的政策,如果您收到损坏的物品,请立即联系我们的客户服务团队并附上损坏的照片。我们将为您安排更换或退款。您希望我帮助您获得退款吗?我需要您提供一些信息,例如您的订单号和有关损坏物品的详细信息,以便我帮助处理您的请求吗?”

通过执行以下步骤,您可以创建一个功能齐全的本地 rag 代理,能够通过实时上下文增强 llm 的性能。此设置可以适应各种领域和任务,使其成为上下文感知生成至关重要的任何应用程序的通用解决方案。

以上就是如何使用 Ollama 和 LangChain 创建本地 RAG 代理的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1348957.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 12:27:56
下一篇 2025年12月13日 12:28:08

相关推荐

  • Django AllAuth 章 使用自定义字段扩展 Django AllAuth 用户模型

    注意:本文最初发布在我的 substack 上,网址为 https://andresalvareziglesias.substack.com/ 这是 django allauth 系列文章的最后一章。在这五章中,我们发现了一个小奇迹,一个非常有用的 django 组件来处理我们所有的身份验证需求。在…

    好文分享 2025年12月13日
    000
  • 如何构建简单的 AI 代理:分步指南

    人工智能无处不在,从回答您问题的聊天机器人到管理您日程安排的智能助手。但您是否知道只需几步即可构建自己的人工智能代理?无论您是开发人员还是好奇的爱好者,本指南都将向您展示如何创建一个可以执行基本任务的简单 ai 代理,同时让事情变得有趣和简单。 ? ?️ 第 1 步:定义 ai 代理的使命 首先,决…

    2025年12月13日
    000
  • 释放 Python 脚本的力量:日复一日的 DevOps 工具系列

    欢迎来到“50 天 50 个 devops 工具”系列的第 28 天!今天,我们将深入探讨 python 脚本世界——这是任何 devops 专业人员的一项关键技能。 python 以其简单性、可读性和广泛的库支持而闻名,已成为自动化任务、管理基础设施和开发可扩展应用程序的重要工具。 为什么 pyt…

    2025年12月13日
    000
  • 使用 Diffuser 运行 Fluxn Mac

    什么是扩散器? 拥抱脸 / 扩散器 ? diffusers:最先进的扩散模型,用于 pytorch 和 flax 中的图像和音频生成。 ? diffusers 是最先进的预训练扩散模型的首选库,用于生成图像、音频甚至分子的 3d 结构。无论您是在寻找简单的推理解决方案还是训练自己的扩散模型,? di…

    2025年12月13日 好文分享
    000
  • 使用 Asyncio 创建和管理任务

    asyncio 允许开发者轻松地用 python 编写异步程序。该模块还提供了多种异步任务的方法,并且由于执行方法多种多样,因此可能会让人困惑于使用哪一种。 在本文中,我们将讨论使用 asyncio 创建和管理任务的多种方法。 什么是异步任务? 在 asyncio 中,task 是一个包装协程并安排…

    2025年12月13日
    000
  • 了解 Python 中常规类和数据类之间的差异

    介绍 在python中定义数据结构可以通过各种方法来完成。两种常用的方法是常规类和数据类。了解这两种方法之间的差异有助于为给定任务选择最合适的选项。本文对常规类和数据类进行了比较分析,强调了它们各自的特点和适当的用例。 常规课程 python 中的常规类是创建对象的传统方式。它需要对各种方法和属性进…

    2025年12月13日
    000
  • 关于如何使用 pip 安装你需要知道的一切

    在本文中,我们正在研究使用 pip 将代码安装到虚拟环境中的不同方法。 这些会变得更加复杂,但不用担心,我会全程陪伴您。 拍拍你的背 废话说够了!让我们从简单的事情开始吧。 安装本地存储库 假设以下情况:您刚刚签出了存储库并想要安装需求。 这可以通过使用以下命令轻松完成……当…

    2025年12月13日
    000
  • 在深入了解 Nylas 之前需要了解的关键概念

    在深入研究 nylas 之前必须了解的概念 所以,我已经准备好开始使用 nylas 及其强大的 api,但在开始之前,值得花点时间确保我很好地掌握了一些基本概念。这些构建块不仅可以帮助我有效地使用 nylas,还可以使我的开发过程更加顺利和安全。 1.python虚拟环境:保持整洁 让我们从pyth…

    2025年12月13日
    000
  • Python-文件

    文件操作: 文件读取文件写入追加内容 文件读取:以 open(‘logs.txt’, ‘r’) 作为文件: open是python内置函数,用于打开文件。第一个参数是文件名,第二个参数是读取模式。with语句用于自动关闭文件。这将防止内存泄漏,提供更好…

    2025年12月13日
    000
  • 使用 AWS 学习 Python – 第 2 天

    虚拟环境 今天我们将学习虚拟环境。 python 中的虚拟环境是一个容器,所有代码和其他 python 包都驻留在其中。它允许您将 python 配置与系统上的其他版本分开。开发 python 代码时始终使用虚拟环境是一个好主意。 要创建虚拟环境,我们将使用以下命令: python -m venv …

    2025年12月13日
    000
  • Python 库初学者指南

    python 以其简单性和多功能性而闻名,使其成为初学者和专业人士的热门选择。 python 最强大的功能之一是其广泛的库集合。这些库是预先编写的代码的集合,您可以使用它们来执行常见任务,从而节省您的时间和精力。在这篇博客中,我们将探索每个初学者都应该知道的一些基本 python 库。 1.什么是p…

    2025年12月13日
    000
  • tea-tasting:用于 A/B 测试统计分析的 Python 包

    简介 我开发了tea-tasting,一个用于 a/b 测试统计分析的 python 包,具有​​: 学生的 t 检验、bootstrap、cuped 方差缩减、功效分析以及其他开箱即用的统计方法和方法。支持广泛的数据后端,例如 bigquery、clickhouse、postgresql/gree…

    2025年12月13日
    000
  • Python – 字典、集合、元组

    这三个都是python中不同类型的数据结构。这用于存储不同的数据集合。根据我们要求的用例,我们需要在其中进行选择。 字典(dict): 字典是键值对的集合,其中每个键与一个值关联可以根据键值检索数据(基于键的搜索),因为键要求是唯一的。字典在 3.7 之前都是无序的,值可以更改。密钥名称不能直接更改…

    2025年12月13日
    000
  • 精通编码之路初学者指南

    您已经掌握了编码的基础知识。循环、函数,甚至简单的网站都在你的掌握之中。 但是从休闲程序员转变为专业程序员需要什么? 好吧,我在这里帮助正在寻找相同东西的初学者。 让我们潜入吧。 专业心态:不仅仅是代码 解决问题 编码既是关于编写代码,也是关于解决问题。将复杂的问题分解为更小的、可管理的步骤至关重要…

    2025年12月13日
    000
  • 使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统

    介绍 信用卡欺诈对金融业构成重大威胁,每年造成数十亿美元的损失。为了解决这个问题,人们开发了机器学习模型来实时检测和防止欺诈交易。在本文中,我们将逐步介绍使用 fastapi(python 的现代 web 框架)以及在 kaggle 流行的信用卡欺诈检测数据集上训练的随机森林分类器构建实时信用卡欺诈…

    2025年12月13日
    000
  • Jupyter Notebooks 作为端到端分析解决方案

    介绍 你醒了。您查看待办事项列表,发现团队成员有一项任务。他们希望您进行某种分析并生成报告。请求本身相对复杂,这意味着您可能需要使用问题陈述对其进行分解,从数据源中提取数据,进行探索,收集您的见解,然后向团队成员讲述您的发现故事。 解决这个问题的方法如下: 在任务跟踪平台(例如 Trello、Jir…

    2025年12月13日
    000
  • python程序语言运算符

    python 将运算符分为以下几组运营商类型算术运算符赋值运算符比较运算符 逻辑运算符按位运算符会员经营者 节目 算术运算符 算术运算符是数值是数学运算符1.添加2.减法3.乘法4.划分5.模块6.楼层划分 添加 a=3b=2打印(a + b)欧/普5 减法 a=6b=5打印(a-b)欧/普1 乘法…

    2025年12月13日
    000
  • 在 AWS 中转换文件更快、更便宜:Polar 或 Pandas?

    两者都提供了广泛的工具和优势,这可能会让我们在某些时候怀疑选择两者中的哪一个。这并不是要改变公司的所有流程,以便他们开始使用 polars 或 pandas“死亡”(这不会在不久的将来发生)。这是关于了解其他可以帮助我们降低流程成本和时间、获得相同或更好结果的工具。 当我们使用云服务时,我们会优先考…

    2025年12月13日
    000
  • 从 Javascript 过渡到 Python:初学者之旅

    我的全栈开发之路 作为成为全栈开发人员的旅程的一部分,我从 javascript 和 react 开始。在成功完成这些技术的项目后,我开始学习 python、sql 并创建自己的 cli 菜单。这个变化既令人兴奋又充满挑战,因为 python 的简单性最初让我怀疑它是否真的那么容易。 拥抱 pyth…

    2025年12月13日
    000
  • DevOps 中脚本语言的力量:日复一日的 DevOps 工具系列

    欢迎来到“50 天 50 个 DevOps 工具”系列的第 26 天!今天,我们将把重点从特定工具转移到 DevOps 和 IT 自动化的基本方面——脚本语言。脚本编写是 DevOps 中自动化、编排和配置管理的支柱。了解如何有效地使用脚本语言可以显着提高 DevOps 工程师的效率和生产力。 什么…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信