使用DeepSeek+RAG实现私人知识库

在使用包括 chatgpt 在内的 aigc 工具回答 sap 相关问题时,常常会遇到大模型产生不准确或虚构信息的情况,这种现象被称为大模型的幻觉现象。对于 llm 模型来说,它是一种基于上下文的生成模型,其预测依赖于先前的文本序列。由于模型在训练过程中学习了语言的统计规律,有时会在生成文本时添加一些不合逻辑或与实际情况不符的内容。这种现象并非模型故意为之,而是由于模型参数中存储的知识是固定的且有限的,而现实世界的信息却在不断更新。

为了减少或避免大模型的幻觉现象,RAG(Retrieval-Augmented Generation)是一种有效的解决方案。当用户向通过 RAG 增强的大语言模型提问时,系统首先通过检索模块(Retriever)从外部知识库中查找相关文档,然后将检索结果与原始问题共同输入生成模块(Generator)进行答案合成。与模型参数中固化的知识不同,外部知识库的内容可以实时更新,从而让大语言模型提供实时的准确回复。外部知识库通常存储在数据库中,如向量数据库。

本文将通过 DeepSeek、Ollama 和 AnythingLLM 三个工具,手动上传 SAP 文档,来演示如何基于 RAG 架构打造自己的个人 SAP 知识库。

实现工具与操作步骤

1)安装 Ollama 并运行 DeepSeek

Ollama 是一个用于在本地环境运行大语言模型的工具。它允许开发者在本地 GUI 或命令行中加载和运行各种 AI 模型,无需深入理解底层的机器学习框架。Ollama 的设计思路类似于 Docker,通过它管理的 AI 模型类似于 Docker Image,但 Ollama 专门针对 AI 模型进行了优化。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

使用DeepSeek+RAG实现私人知识库

Ollama 安装成功后,使用命令行 ollama run deepseek-r1:1.5b,这个命令会自动下载 DeepSeek 模型到本地并运行。1.5b 表示下载参数个数为 15 亿的 DeepSeek 版本,为了节省时间,笔者选择了这个文件尺寸为 1.1 GB 的最精简的模型。

使用DeepSeek+RAG实现私人知识库

耐心等待下载结束,看到命令行里弹出 think 提示符,输入 who are you? 得到 DeepSeek 的自我介绍回复,说明 Ollama 和自动下载的 DeepSeek R1 已经正常工作了。

2)上传 SAP 文档作为知识库素材

既然是打造私人的 SAP 知识库,我们就需要给 DeepSeek 喂一些外部文档作为知识库的文档素材。在 Bing 搜索引擎里使用 site:sap.com filetype:pdf 随便搜一些 SAP 官方发布的 PDF 来测试。在实际使用场景中,企业级客户可以将自己的私密数据,喂给本地部署的大模型,而不用担心隐私泄漏的问题。

使用DeepSeek+RAG实现私人知识库

这里我从 Bing 的搜索结果下载了一个名为 SAP S4HANA private cloud - implementation guide.pdf 的文件。

使用DeepSeek+RAG实现私人知识库

3)使用 AnythingLLM 建立工作区

下一步,下载 AnythingLLM 并安装。AnythingLLM 是一个开源的 AI 工具,能够方便地将用户提供的各种格式的文档嵌入到自定义 AI 模型中,使其在同用户对象中作为可参考上下文的一部分。这意味着通过 AnythingLLM, AI 模型在回答问题时,可以检索和分析用户提供的文档,将其内容整合作为最终的输出,即本文开头部分介绍的 RAG 工作方式。

使用DeepSeek+RAG实现私人知识库使用DeepSeek+RAG实现私人知识库

AnythingLLM 安装完毕之后,像使用 ABAP Development Tool 一样,新建一个工作区(Workspace):

使用DeepSeek+RAG实现私人知识库

点击「聊天设置」:

使用DeepSeek+RAG实现私人知识库

还记得我们刚才下载的 Ollama 和通过 ollama run 命令下载的 DeepSeek R1 吗?在工作区 LLM 提供者的下拉菜单中,找到通过 Ollama 管理的 DeepSeek R1。

这个设置的意思是,我们接下来可以通过 AnythingLLM 提供的 GUI 窗口,同 DeepSeek 对话,可以同 Ollama 自带的命令行窗口说再见了。

使用DeepSeek+RAG实现私人知识库

4)文档嵌入与向量数据库

接下来通过向量数据库来上传并存储用户提供的文档。点击上传图标,打开上传对话框:

使用DeepSeek+RAG实现私人知识库

点击 Upload 区域,将刚才从 Bing 搜索下载的 SAP S/4HANA private cloud PDF 文档上传:

使用DeepSeek+RAG实现私人知识库

怪兽AI知识库 怪兽AI知识库

企业知识库大模型 + 智能的AI问答机器人

怪兽AI知识库 51 查看详情 怪兽AI知识库

待文档上传完毕,点击 Save and Embed 按钮,将文档内容转换成向量数据并执行嵌入操作。

使用DeepSeek+RAG实现私人知识库

向量数据库是一种用于存储和查询高维向量数据的数据库,其核心功能是提供高效的相似度搜索,使得查询向量能够找到与之最接近的向量。相比传统关系型数据库(如 MySQL、PostgreSQL),向量数据库更适合存储和检索非结构化数据,如文本、图像、音频等。

在 RAG 架构中,向量数据库的作用类似于一个知识库,它存储了大量文本片段的嵌入(Embeddings),当用户输入查询时,模型会将查询转换为向量,并在数据库中检索最相关的向量,进而找到对应的文本内容。这种方式大幅提高了生成式 AI 的可控性和可解释性。

使用DeepSeek+RAG实现私人知识库

文档嵌入(Embedding)是将文本数据转换为向量的过程。这一过程的核心是将文本内容映射到一个高维向量空间中。相似的文本在该空间中的距离较近,而不相关的文本距离较远。

当然在实际企业级应用中,除了小规模的人工手动上传文档外,AnythingLLM 也支持通过 Data Connection 进行批量上传大规模文档,比如批量上传某个 Github Repo 里的文件。这种模型下,AnythingLLM 读取 Github 仓库内容的方式,通过 Access Token 完成。

使用DeepSeek+RAG实现私人知识库

等我们上传的文件出现在工作区右边区域后,说明文档的向量化即嵌入操作已经完成。

使用DeepSeek+RAG实现私人知识库

效果验证

此时,我们回到 AnythingLLM 同 DeepSeek 的对话窗口,提出一个问题:

What is embedded EWM?

使用DeepSeek+RAG实现私人知识库

DeepSeek 给出的回答的确是基于我们刚刚上传的 PDF 文件来完成的。

这一点可以从 DeepSeek 回复的 Citation 即引用区域得到证实,该区域显示本次回答引用了 SAP S4HANA private cloud edition.pdf 这个文件。

使用DeepSeek+RAG实现私人知识库

后记:模型部署

对于企业级用户而言,大模型的私有部署,在数据安全性、响应速度、可定制化、长期成本以及可靠性等多个方面都有着显著优势。而对于个人 AI 学习者来说,可以选择本地部署或者在某个云服务提供商的基础设施(IaaS)上进行私有部署的尝试。

笔者现在使用的笔记本电脑,本地部署满血 DeepSeek 比较吃力。所以,我选择了 PHP 中文网 HAI,这样就不用自己掏钱升级硬件了。

你可以登录腾讯 HAI 控制台,新建一个 Windows Server 实例:

使用DeepSeek+RAG实现私人知识库

使用 Windows 自带的 Remote Desktop Connection 登录到创建好的 HAI 实例上。

使用DeepSeek+RAG实现私人知识库

笔者之前曾发布过文章《使用腾讯 HAI 5 分钟内部署一个私人定制的 DeepSeek》,详细介绍了采用私有部署方式运行 DeepSeek 的步骤,有兴趣的小伙伴可前往了解。

通过本文展示的步骤,即使是一个不了解大语言模型底层实现细节的普通用户,借助 Ollama 和 AnythingLLM 这两个工具,也能轻松完成 DeepSeek 的本地部署,并打造自己的私人知识库。

SAP 在官方社区上也发布了其在 AI 和 RAG 领域很多积极的尝试,笔者后续的文章会继续给大家介绍!

以上就是使用DeepSeek+RAG实现私人知识库的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/259159.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月4日 08:26:45
下一篇 2025年11月4日 08:32:48

相关推荐

  • 2025年安全正规的十大数字货币交易平台汇总

    2025年,市场上涌现了众多交易平台,但以下十大数字货币交易平台因其卓越的安全性、用户体验和广泛的市场覆盖而脱颖而出。排名第一的binance以其强大的交易量和丰富的交易对闻名,第二名的okx则以其创新的交易工具和高效的客户服务著称,第三名的火币则凭借其悠久的历史和稳定的表现赢得了用户的信赖。接下来…

    2025年12月8日 好文分享
    000
  • 速读瑞士加密银行Amina 2024年收入达4000万美元,加密资产管理规模翻倍

    瑞士加密银行amina银行(前身为seba银行)公布了2024年的创纪录财务业绩,收入同比增长69%,达到4040万美元。 根据5月28日的新闻发布,该银行的资产管理规模(AUM)增长了136%,达到42亿美元,这主要得益于机构需求和战略扩张的推动。 这家总部位于苏黎世的银行将增长归功于其跨司法管辖…

    2025年12月8日
    000
  • 最新国际数字货币交易平台TOP10排名揭晓

    随着数字货币市场的迅猛发展,国际数字货币交易平台的竞争日益激烈。为了帮助投资者更好地了解市场现状,我们在此揭晓最新的国际数字货币交易平台TOP10排名。以下是根据交易量、用户数量、安全性和用户体验等多方面因素评选出的前十名交易平台。 1.Binance   Binance成立于2017年,是当前全球…

    2025年12月8日 好文分享
    000
  • 比特币(BTC)市值在-0.31%下降后达到343.7万美元

    当日跌幅达-0.31%之后,当前加密货币的总市值约为3.43吨。同时,加密货币的整体交易量也出现了-0.31%的下滑。 在经历-0.31%的下跌后,加密货币总市值现为3.43吨。在同一时间段内,加密货币交易量同样减少了-0.31%。 在排名前200的加密货币中,表现最优的资产在过去24小时内实现了2…

    2025年12月8日
    000
  • 安币交易所怎么安全下载 安币交易所安全入口

    安币交易所安全下载和访问的步骤包括:1.访问官方网站下载客户端;2.验证文件完整性;3.书签官方网站并使用HTTPS访问;4.启用双重认证并使用强密码进行安全交易。 安币交易所安全下载指南 安币交易所是许多加密货币投资者选择的平台之一。为了确保在使用该交易所时能够安全地进行下载和访问,我们将详细介绍…

    2025年12月8日
    000
  • 十大币圈交易所排行最新 2025币圈十大热门交易所盘点

    2025年币圈十大热门交易所分别是:1. Binance,2. OKX,3. Huobi,4. Coinbase,5. Kraken,6. Bybit,7. Bitfinex,8. KuCoin,9. Bittrex,10. Gemini,这些交易所各具特色,提供多种加密货币交易和金融服务,均采用高…

    2025年12月8日 好文分享
    000
  • 欧意官网打不开 欧意交易所app下载

    欧意官网打不开可以通过检查网络连接、更换DNS服务器;欧意交易所app可在iOS、Android和桌面端下载。访问欧意官网时,若遇到网络连接问题,请确保连接正常并尝试刷新页面。 如果你在访问欧意(OKX)官网时遇到问题,或者想要下载欧意交易所的应用程序,本文将详细介绍如何解决这些问题并提供下载指南。…

    2025年12月8日
    000
  • 2025年度数字资产交易所综合实力排行榜前十汇总

    在2025年,数字资产交易所的竞争愈发激烈,市场上涌现出许多实力强劲的平台。以下是对2025年度综合实力排行榜前十的数字资产交易所的详细汇总,涵盖了每个交易所的关键特点、服务、安全性以及用户体验。 1. Binance(币安)  核心优势:流动性全球第一,日交易量超千亿美元,覆盖600+币种,新币首…

    2025年12月8日 好文分享
    000
  • ok交易所怎么下载 ok交易所官网入口

    如何下载OK交易所应用?在iOS设备上,通过App Store搜索“OKX”或“OK交易所”并下载安装;在Android设备上,通过Google Play Store搜索并下载安装。下载后,登录或注册即可使用。 如何下载OK交易所应用 OK交易所,作为全球知名的加密货币交易平台,提供了一个便捷的移动…

    2025年12月8日
    000
  • ok交易所网页版入口 ok交易所网页版正确地址

    OK交易所网页版入口是www.okx.com。访问方法包括:1. 打开浏览器;2. 输入www.okx.com并按回车;3. 等待页面加载,用户可登录或注册。 OK交易所网页版入口概述 OK交易所是全球知名的加密货币交易平台之一,提供多种数字资产交易服务。访问OK交易所的网页版入口是用户进行交易、管…

    2025年12月8日
    000
  • 火币网页版入口 火币网页版正确地址入口

    火币网页版入口是www.htx.com。用户可通过浏览器访问该网址,无需下载软件,支持多设备访问,界面简洁,功能丰富,提供多重安全措施,客服支持24/7在线。 火币网页版入口是许多用户在进入火币交易平台时最关心的问题之一。火币,作为全球知名的加密货币交易所,提供了多种入口方式来满足不同用户的需求。火…

    2025年12月8日
    000
  • 芝麻开门交易所官方app下载 芝麻开门官网入口

    芝麻开门交易所官方应用可以通过App Store、Google Play或官方网站下载。1. iOS用户在App Store搜索并安装。2. Android用户在Google Play或官方网站下载APK文件并安装。该应用提供交易、资产管理、安全设置和新闻资讯功能。 芝麻开门交易所官方app下载 芝…

    2025年12月8日
    000
  • 什么是比特币现金?2025年价格能达到500美元吗?

    比特币现金 (bch) 作为比特币的一个分叉,凭借更快的交易速度和更低的手续费赢得了声誉。多年来,它作为一种日常使用的数字货币获得了关注。尽管其价格经历了显著波动,但对可扩展区块链解决方案需求的增长让许多人开始质疑 bch 是否有可能达到 10,000 美元这一里程碑。 为了探讨这种可能性,理解推动…

    2025年12月8日
    000
  • Bitget现货网格交易常见陷阱及规避方法

    目录 错误 1:将网格机器人视为被动收入机器错误 2:使用过多网格,却不了解其利弊错误 3:在趋势市场中运行机器人而不进行调整错误 4:误用或忽略高级设置错误 5:网格类型与市场环境不一致错误 6:发布后未能监控和调整最后的想法:对自动化的认识关于 Bitget 现货网格交易的常见问题解答Q1:什么…

    2025年12月8日
    000
  • 加密货币怎么赚钱?虚拟货币赚钱的10种方法大揭秘

    加密货币作为一种新兴的金融工具,已经成为了许多投资者和交易者的关注焦点。那么,加密货币怎么赚钱?本文将详细介绍虚拟货币赚钱的10种方法,帮助你更好地理解和利用这一新兴市场。 买入并持有(HODL) 买入并持有是许多加密货币投资者的首选策略。简单来说,就是在价格较低时购买加密货币,然后长期持有,等待价…

    2025年12月8日 好文分享
    000
  • 2025全球加密货币交易所最新权威榜单发布TOP10

    2025年,全球%ignore_a_2%所的竞争愈发激烈,各大交易所不断优化用户体验、提升安全性、拓展业务范围,以期在市场中占据一席之地。近日,权威机构发布了2025年全球加密货币交易所最新榜单,揭示了当前市场中最受欢迎和信任的TOP10交易所。以下是详细介绍及分析。 Binance  &#8211…

    2025年12月8日 好文分享
    000
  • 2025币圈十大货币交易所是哪些? 盘点币圈十大交易所app最新榜单

    2025年币圈十大货币交易所是:1. Binance,2. OKX,3. Huobi,4. Coinbase,5. Kraken,6. Bybit,7. KuCoin,8. Bitfinex,9. Gemini,10. Bittrex。这些交易所因其高流动性、多样化交易对、安全性、用户友好界面和全球…

    2025年12月8日 好文分享
    000
  • Unilabs在推出之前筹集了超过100万美元,将自己定位为现在购买的最佳成员

    随着2025年meme币市场的持续火热,投资者正积极寻找下一只不足1美元便能爆发的潜力股。 2025年的Meme币市场热度不减,投资者纷纷瞄准下一个可能突破1美元大关的明星币种。 虽然Dogecoin的价格依旧保持稳定,作为最初的Meme币代表,以及像Floki这样新兴的竞争者,都在借助其日益壮大的…

    2025年12月8日
    000
  • 新西兰揭开了国王查尔斯三枚硬币的第一张照片

    伊恩·伍尔福德(ian woolford)表示:“在全面生产启动前,我们已经收到了硬币的预生产样品,目的是对其进行检查和确认。我们对硬币的质量、重量、尺寸、安全特性以及是否符合我们所订购的设计进行了详细审核。” 今日曝光了首枚印有查尔斯三世(Charles III)肖像的10便士硬币的照片。 这枚硬…

    2025年12月8日
    000
  • 欧意交易所怎么安全下载 欧意交易所安全入口

    安全下载和使用欧意交易所应用程序的方法包括:1)通过官方网站下载,确保使用HTTPS协议;2)验证应用程序的真实性,检查开发者信息和图标;3)启用两-factor认证(2FA);4)使用强密码和避免公共Wi-Fi;5)定期检查账户活动;6)使用防病毒软件和密码管理器;7)保持警惕,及时更新软件并备份…

    2025年12月8日
    000

发表回复

登录后才能评论
关注微信