本地运行性能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服务，太方便了！

程序猿 • 2025年11月11日 03:55:18 • 科技 • 阅读 1

ollama 是一款超级实用的工具，让你能够在本地轻松运行 llama 2、mistral、gemma 等开源模型。本文我将介绍如何使用 ollama 实现对文本的向量化处理。如果你本地还没有安装 ollama，可以阅读这篇文章。

本文我们将使用 nomic-embed-text[2] 模型。它是一种文本编码器，在短的上下文和长的上下文任务上，性能超越了 OpenAI text-embedding-ada-002 和 text-embedding-3-small。

启动 nomic-embed-text 服务

当你已经成功安装好 ollama 之后，使用以下命令拉取 nomic-embed-text 模型：

ollama pull nomic-embed-text

待成功拉取模型之后，在终端中输入以下命令，启动 ollama 服务：

ollama serve

之后，我们可以通过 curl 来验证 embedding 服务是否能正常运行：

curl http://localhost:11434/api/embeddings -d '{"model": "nomic-embed-text","prompt": "The sky is blue because of Rayleigh scattering"}'

使用 nomic-embed-text 服务

接下来，我们将介绍如何利用 langchainjs 和 nomic-embed-text 服务，实现对本地 txt 文档执行 embeddings 操作。相应的流程如下图所示：

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

1.读取本地的 txt 文件

import { TextLoader } from "langchain/document_loaders/fs/text";async function load(path: string) {const loader = new TextLoader(path);const docs = await loader.load();return docs;}

在以上代码中，我们定义了一个 load 函数，该函数内部使用 langchainjs 提供的 TextLoader 读取本地的 txt 文档。

2.把 txt 内容分割成文本块

import { RecursiveCharacterTextSplitter } from "langchain/text_splitter";import { Document } from "langchain/document";function split(documents: Document[]) {const splitter = new RecursiveCharacterTextSplitter({chunkSize: 500,chunkOverlap: 20,});return splitter.splitDocuments(documents);}

在以上代码中，我们使用 RecursiveCharacterTextSplitter 对读取的 txt 文本进行切割，并设置每个文本块的大小是 500。

3.对文本块执行 embeddings 操作

const EMBEDDINGS_URL = "http://127.0.0.1:11434/api/embeddings";async function embedding(path: string) {const docs = await load(path);const splittedDocs = await split(docs);for (let doc of splittedDocs) {const embedding = await sendRequest(EMBEDDINGS_URL, {model: "nomic-embed-text",prompt: doc.pageContent,});console.dir(embedding.embedding);}}

在以上代码中，我们定义了一个 embedding 函数，在该函数中，会调用前面定义的 load 和 split 函数。之后对遍历生成的文本块，然后调用本地启动的 nomic-embed-text embedding 服务。其中 sendRequest 函数用于发送 embeding 请求，它的实现代码很简单，就是使用 fetch API 调用已有的 REST API。

AI-Text-Classifier

OpenAI官方出品，可以区分人工智能书写的文本和人类书写的文本

27 查看详情

async function sendRequest(url: string, data: Record) {try {const response = await fetch(url, {method: "POST",body: JSON.stringify(data),headers: {"Content-Type": "application/json",},});if (!response.ok) {throw new Error(`HTTP error! status: ${response.status}`);}const responseData = await response.json();return responseData;} catch (error) {console.error("Error:", error);}}

接着，我们继续定义一个 embedTxtFile 函数，在该函数内部直接调用已有的 embedding 函数并添加相应的异常处理。

async function embedTxtFile(path: string) {try {embedding(path);} catch (error) {console.dir(error);}}embedTxtFile("langchain.txt")

最后，我们通过 npx esno src/index.ts 命令来快速执行本地的 ts 文件。若成功执行 index.ts 中的代码，在终端将会输出以下结果：

图片

其实，除了使用上述的方式之外，我们还可以直接利用 @langchain/community 模块中的 [OllamaEmbeddings](https://js.langchain.com/docs/integrations/text_embedding/ollama “OllamaEmbeddings”) 对象，它内部封装了调用 ollama embedding 服务的逻辑：

import { OllamaEmbeddings } from "@langchain/community/embeddings/ollama";const embeddings = new OllamaEmbeddings({model: "nomic-embed-text", baseUrl: "http://127.0.0.1:11434",requestOptions: {useMMap: true,numThread: 6,numGpu: 1,},});const documents = ["Hello World!", "Bye Bye"];const documentEmbeddings = await embeddings.embedDocuments(documents);console.log(documentEmbeddings);

本文介绍的内容涉及开发 RAG 系统时，建立知识库内容索引的处理过程。如果你对 RAG 系统还不了解的话，可以阅读相关的文章。

参考资料

[1]Ollama: https://ollama.com/

[2]nomic-embed-text: https://ollama.com/library/nomic-embed-text

以上就是本地运行性能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服务，太方便了！的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/615763.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

到2028年，医疗保健聊天机器人市场将达到10亿美元

上一篇 2025年11月11日 03:54:38

马斯克的首款多模态大模型来了，GPT-4V又被超越了一次

下一篇 2025年11月11日 03:55:57

好文分享

静态重定位技术的优势与发展前景的研究

探究静态重定位技术的优势与发展前景技术的不断进步为我们带来了很多方便和效率，其中之一就是静态重定位技术。静态重定位技术是一种将程序加载到内存中的技术，通过修改程序中的地址，使其能够在不同的内存位置运行。本文将探究静态重定位技术的优势以及发展前景，并提供一些具体的代码示例作为参考。静态重定位技术有…

程序猿
2025年12月24日
0000
好文分享

掌握网页性能受绘制和布局的影响

了解重绘和回流对网页性能的影响，需要具体代码示例简介：网页的性能是用户体验的关键因素之一。在优化网页性能的过程中，了解重绘和回流的概念及其对网页性能的影响非常重要。本文将详细讲解重绘和回流的含义，并举例说明它们对网页性能的影响。同时，提供一些优化的技巧和建议，以减少重绘和回流的次数，从而提升网页性…

程序猿
2025年12月24日
0000
好文分享

通过使用Web标准，提升网页性能与用户体验的方法

随着互联网的快速发展，越来越多的企业和个人都开始关注网页的性能和用户体验。一方面，良好的网页性能可以提高网站的可访问性和搜索引擎排名，另一方面，优秀的用户体验可以增加用户的黏性和转化率。而借助Web标准来优化网页性能与用户体验，则成为现如今的一种主流方法。那么，如何利用Web标准来优化网页性能与用…

程序猿
2025年12月24日
0000
好文分享

CSS网页布局优化：提高网页加载速度和性能

CSS 网页布局优化：提高网页加载速度和性能，需要具体代码示例随着互联网的发展，用户对于网页加载速度和性能的要求越来越高。而对于网页开发者来说，优化网页布局是提高网页加载速度和性能的重要一环。在本文中，我们将分享一些实用的 CSS 优化技巧，并提供具体的代码示例。选择合适的布局方式合适的布局方式…

程序猿
2025年12月24日
0000
好文分享

如何使用CSS3动画功能提升网页性能和用户体验

如何使用CSS3动画功能提升网页性能和用户体验在如今的互联网时代，网页设计已经成为了人们经常接触的一种艺术形式。而其中，动画效果在网页设计中起到了至关重要的作用，可以为用户呈现出更加生动、丰富的内容，提升用户的使用体验。然而，过多或不适当的动画效果也可能会给网页性能和用户体验带来负面影响。本文将介…

程序猿
2025年12月24日
0000
提高css性能的方法

这篇文章主要介绍了css性能优化提高css性能的方法，不规范的css会导致很多性能问题，所以学习掌握css性能优化技巧是非常必要的，对css性能优化知识感兴趣的朋友一起学习吧不规范的css会导致很多性能问题，这些问题可能在一些小的项目中不够明显，但是在大型项目中就会显现出来。 css匹配原理在优…

程序猿
好文分享 2025年12月24日
0000
好文分享

vscode运行html慢怎么办_解vscode运行html慢问题【技巧】

使用Live Server插件启动本地服务器预览HTML，禁用非必要扩展以释放资源，优化大体积静态文件引入方式，清除浏览器缓存并切换至高性能浏览器，调整VSCode自动保存与文件监听设置，可显著提升加载速度。如果您在使用VSCode运行HTML文件时发现加载或预览速度较慢，可能是由于插件配置、浏览…

程序猿
2025年12月23日
0000
好文分享

从OpenAI API响应中高效提取文本内容

本文详细指导如何从openai gpt系列模型的api json响应中准确提取所需的文本内容。我们将重点介绍如何利用json解析器处理api返回的结构化数据，避免直接字符串操作的常见错误，并通过具体代码示例演示如何访问choices数组中的生成文本，并探讨处理多条生成结果的方法，确保开发者能高效、稳…

程序猿
2025年12月23日
0000
好文分享

从OpenAI API响应中高效提取生成文本

本文旨在指导开发者如何正确解析OpenAI API返回的JSON格式响应，并从中提取所需的生成文本内容。通过详细的步骤和代码示例，我们将展示如何使用`JSON.parse()`方法处理API响应，并精确访问`choices[0].text`属性以获取核心文本输出，同时探讨处理多条生成结果的方法及相关…

程序猿
2025年12月23日
0000
好文分享

如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

使用HTML构建标签结构，CSS3添加旋转与过渡效果，JavaScript生成随机HSL颜色并设置字体大小，实现动态交互的标签云组件。要在网页中实现一个动态的标签云组件，结合 HTML、CSS3 变换和随机颜色生成算法，可以按照以下步骤操作。这个组件不仅能提升页面视觉效果，还能通过色彩和旋转增加交…

程序猿
2025年12月23日
0000
好文分享

如何在Go Gin应用中集成前端JavaScript模块（如Sentry）

本文探讨了在Go Gin框架下，通过HTML模板服务前端页面时，如何有效集成JavaScript模块（如Sentry）。针对浏览器不直接支持Node.js模块导入语法的问题，文章详细阐述了利用CDN引入Sentry SDK的解决方案，并提供了具体的代码示例，帮助开发者实现前端错误监控功能，避免了复杂…

程序猿
2025年12月23日
0000
好文分享

html官网浏览入口_html网站设计免费平台

html官网浏览入口在https://www.codepen.io，该平台支持实时预览代码、创建Pen项目、Fork开源示例，可添加外部资源，具备点赞评论收藏等社区互动功能，设有挑战活动与作品集分类，开放API接口，界面简洁适合初学者，在线编写无需配置环境，支持多种预处理器和响应式测试。 html官…

程序猿
2025年12月23日
0000
好文分享

前端后端开发的发展历程与趋势展望

随着互联网的迅猛发展和信息技术的日新月异，前端和后端开发作为两个重要的IT领域在过去几十年中也取得了巨大的进步。本文将探讨前端后端开发的发展历程，分析当前的发展趋势，并展望未来的发展方向。一、前端后端开发的发展历程早期阶段在互联网刚刚兴起的时期，网站开发主要关注内容的呈现，前端开发工作主要集中在…

程序猿
2025年12月22日
0000
好文分享

如何评估网站性能优化的关键因素：衡量网站性能优化效果的方法

提升网站性能的关键指标：如何衡量网站性能的优化效果？随着互联网的飞速发展，网站已经成为人们获取信息、进行购物和娱乐的一个重要平台。然而，当网站访问变得缓慢或不可靠时，用户会感到不满，并可能选择离开。因此，提升网站性能是至关重要的。但是，如何衡量网站性能的优化效果呢？本文将介绍一些关键的指标。一：…

程序猿
2025年12月22日
0000
好文分享

优化前端工程：提升页面性能和用户满意度，有效解决页面重绘和回流问题

前端工程优化：应对页面重绘和回流，提升页面性能和用户满意度，需要具体代码示例随着互联网技术的快速发展，越来越多的企业和个人开始意识到网页性能的重要性。优化前端工程不仅可以提升网站的加载速度，更能够增加用户的满意度和提升用户体验。而在前端工程优化中，处理页面重绘和回流是一个非常关键的问题。页面重绘…

程序猿
2025年12月21日
0000
好文分享

性能受回流和重绘的差异的影响程度

回流和重绘的差异对性能的影响，需要具体代码示例在前端开发中，我们经常会遇到需要对页面进行修改的情况，比如改变元素的样式、大小或位置等。然而，这些改变并不是无成本的，它们会引发浏览器的回流和重绘操作，对页面的性能产生影响。回流（reflow）和重绘（repaint）是浏览器在对页面进行修改时的两种…

程序猿
2025年12月21日
0000
好文分享

性能消耗比较：回流与重绘哪个更耗费资源？

回流与重绘：哪个更耗费性能？在前端开发中，性能优化是一个重要的议题。其中一个性能瓶颈是浏览器的回流(reflow)和重绘(repaint)操作。在这篇文章中，我们将探讨回流与重绘的定义，并通过具体的代码示例来比较它们的性能损耗。回流是指浏览器重新计算页面元素的位置和几何属性的过程。当布局发生改变…

程序猿
2025年12月21日
0000
好文分享

网页性能受回流和重绘的影响

回流和重绘对网页性能的影响，需要具体代码示例随着互联网的飞速发展，网页性能成为了一个不容忽视的问题。用户对于网页的加载速度和交互流畅性有着越来越高的要求。而回流和重绘作为网页渲染的关键环节，对网页性能有着重要影响。了解回流和重绘的原理，并针对性地优化代码，可以极大地提升网页的性能和用户体验。首先…

程序猿
2025年12月21日
0000
好文分享

优化页面性能：重绘、重排和回流的最佳选择

重绘、重排和回流：如何选择最佳方案？在前端开发中，优化网页性能是一个非常重要的任务。其中，最关键的一点就是如何减少页面的重绘、重排和回流，以提高页面渲染的速度和性能。本文将介绍什么是重绘、重排和回流，并讨论如何选择最佳方案来优化页面性能。重绘、重排和回流是浏览器在渲染页面时的一系列过程。重绘是指…

程序猿
2025年12月21日
0000
好文分享

性能分析：回流与重绘的消耗对比

性能消耗：回流和重绘的对比分析，需要具体代码示例前言：在Web开发中，性能优化一直是一个重要的话题。在网页渲染过程中，最常见的性能消耗就是回流（reflow）和重绘（repaint）。本文将对回流和重绘进行详细对比分析，并给出具体的代码示例，以帮助读者更好地理解和优化性能。一、回流和重绘的概念解…

程序猿
2025年12月21日
1000