利用Azure语义搜索与OpenAI,打造认知搜索系统

在当今的数字时代,拥有强大、可扩展且高效的系统不仅仅是一种竞争优势,更是一种竞争优势。这是必要的。无论您是努力优化用户输入处理旨在简化文档搜索,多种服务和平台的结合都是获得无与伦比性能的关键。在本文中,我们将探索一种将 Azure 认知服务的强大功能与 OpenAI 的功能相结合的整体方法。通过深入研究意图识别、文档过滤、特定领域的算法和文本摘要,您将学习创建一个不仅可以理解用户意图而且可以有效处理和呈现信息的系统。

我们将构建这个:

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

image.png

设置环境

在我们深入之前,让我们确保已经安装了必要的软件包并设置了环境变量:

!pip show azure-search-documents%pip install azure-search-documents --pre%pip show azure-search-documents!pip install python-dotenv!pip install openaiimport osimport requestsimport jsonimport openaiopenai.api_key = os.getenv("AZURE_OPENAI_KEY")openai.api_base = os.getenv("AZURE_OPENAI_ENDPOINT")openai.api_type = 'azure'openai.api_version = '2023-05-15'# Look in Azure OpenAI Studio > Deploymentsdeployment_name = 'gpt-35-turbo'

在这里,我们使用必要的 API 密钥、端点和类型来设置 OpenAI 环境。

设置 Azure 搜索

要使用Azure语义搜索,我们需要导入必要的模块并设置环境。

import osfrom azure.core.credentials import AzureKeyCredentialfrom azure.search.documents.indexes import SearchIndexClientfrom azure.search.documents import SearchClientfrom azure.search.documents.indexes.models import (    ComplexField,    CorsOptions,    SearchIndex,    ScoringProfile,    SearchFieldDataType,    SimpleField,    SearchableField)

导入模块后,我们现在可以设置 azure 搜索服务端点和 api 密钥:

# 从环境中设置服务端点和 API 密钥service_name = "xxxxx"admin_key ="xxxxx"# 如果您共享密钥 - 请确保您的 index_name 是唯一的!index_name = "hotels-quickstart"# 创建 SDK 客户endpoint = "https://{}.search.windows.net/".format(service_name)admin_client = SearchIndexClient(endpoint=endpoint,                      index_name=index_name,                      credential=AzureKeyCredential(admin_key))search_client = SearchClient(endpoint=endpoint,                      index_name=index_name,                      credential=AzureKeyCredential(admin_key))

(注意:在共享任何代码之前,请务必掩盖或隐藏您的密钥。)

为 Azure 语义搜索准备索引

在将数据添加到 Azure 搜索之前,我们需要定义一个描述数据结构的索引:

# 删除索引(如果存在)try:    result = admin_client.delete_index(index_name)    print ('Index', index_name, 'Deleted')except Exception as ex:    print (ex)

此代码片段确保如果索引已存在,则将其删除。这在重新运行代码或更改索引时很有用。

现在,让我们指定索引的架构:

# 指定索引模式name = index_name fields = [         SimpleField(name= "HotelId" , type=SearchFieldDataType.String, key= True ),         SearchableField(name= "HotelName" , type=SearchFieldDataType.String, sortable= True ),         SearchableField (名称= “描述”,类型=SearchFieldDataType.String,analyzer_name= “en.lucene”),        SearchableField(名称= “Description_fr”,类型=SearchFieldDataType.String,analyzer_name= “fr.lucene”),        SearchableField(名称= “类别”、 type=SearchFieldDataType.String、facetable= True、filterable= True、sortable= True )、        SearchableField(name= "Tags"、collection= True、type=SearchFieldDataType.String、facetable= True、filterable= True )、        SimpleField(name = “ParkingInincluded”,类型=SearchFieldDataType.Boolean,facetable= True,filterable= True,sortable= True),        SimpleField(name= “LastRenovationDate”,type=SearchFieldDataType.DateTime关闭设置,facetable= True,filterable=True、sortable= True )、        SimpleField(name= "Rating"、 type=SearchFieldDataType.Double、facetable= True、filterable= True、sortable= True )、        ComplexField(name= "地址"、 fields=[             SearchableField(name= " StreetAddress"、 type=SearchFieldDataType.String)、            SearchableField(name= "City"、 type=SearchFieldDataType.String、facetable= True、 filterable= True、 sortable= True )、            SearchableField(name= "StateProvince"、 type=SearchFieldDataType.String、facetable= True、filterable= True、sortable= True )、            SearchableField(name= "邮政编码"、 type=SearchFieldDataType.String、facetable= True、filterable= True、sortable= True )、            SearchableField(name = “国家”,类型= SearchFieldDataType.String,facetable = True,filterable = True,sortable = True),        ])    ] cors_options = CorsOptions(allowed_origins = [ “*” ],max_age_in_seconds = 60)Scoring_profiles = [] suggester = [{ 'name' : 'sg' , 'source_fields' : [ '标签' , '地址/城市' , '地址/国家' ]}]

接下来,您必须在 Azure 上创建此索引:

index = SearchIndex(    name=name,    fields=fields,    scoring_profiles=scoring_profiles,    suggesters = suggester,    cors_options=cors_options)try:    result = admin_client.create_index(index)    print ('Index', result.name, 'created')except Exception as ex:    print (ex)

创建索引后,我们需要用文档填充它。需要指出的是,它可以是任何类型的文档!我只是在此处手动添加将保留在 blob 存储中的文档:

文档 = [     {     "@search.action": "上传", "@search.action" : "上传" ,     "HotelId" : "1" ,     "HotelName" : "秘密点汽车旅馆" ,     "Description" : "酒店地理位置优越,位于纽约市中心的城市主要商业干道上。几分钟即可到达时代广场和城市的历史中心,以及使纽约成为美国最具吸引力的城市之一的其他名胜古迹和国际大都市。” ,    “Description_fr”:“L'hôtel est idéalement situé sur la prime artère Commerciale de la ville en plein cœur de New York.A insi que d'autres lieux d'intérêt qui font纽约的城市充满魅力和美国的国际化。” ,     "Category" : "精品店" ,     "Tags" : [ "游泳池" , "空调" , "礼宾服务" ],     "ParkingInincluded" : "false" ,     "LastRenovationDate" : "1970-01-18T00:00:00Z ”,    "Rating" : 3.60 ,     "Address" : {            “StreetAddress”:“677 第五大道”,        “City”:“纽约”,        “StateProvince”:“纽约” ,        “PostalCode”:“10022”,        “Country”:“美国”         }     },    {     “@search. action" : "上传" ,     "HotelId" : "2" ,     "HotelName" : "双圆顶汽车旅馆" ,     "Description" :“该酒店坐落在一座十九世纪的广场上,该广场已按照最高建筑标准进行扩建和翻新,打造出一座现代化、实用的一流酒店,艺术和独特的历史元素与最现代的舒适设施共存。” ,     "Description_fr" : "L'hôtel 位于十九世纪的地方,是一座现代化酒店的高级规范建筑,在艺术和历史独特方面具有一流的功能和一流的设计舒适与现代共存。” ,     "Category" : "精品店" ,     "Tags" : [ "泳池" ,],     "ParkingInincluded" : "false" ,     "LastRenovationDate" : "1979-02-18T00:00:00Z" ,     "Rating" : 3.60 ,     "Address" : {         "StreetAddress" : "140 大学城中心" ,         "City”:“萨拉索塔”,        “StateProvince”:“佛罗里达州”,        “PostalCode”:“34243”,        “Country”:“美国”         }     },    {     "@search.action" : "上传" ,     "HotelId" :"3" ,     "HotelName" : "三重景观酒店" ,     "Description" : "该酒店在 William Dough 的管理下以其卓越的美食脱颖而出,他为酒店的所有餐厅服务提供建议并监督。" ,     "Description_fr" : "L'hôtel 位于十九世纪的地方,是一座现代化酒店的高级规范建筑,在艺术和历史独特方面具有一流的功能和一流的设计舒适与现代共存。” ,     "Category" : "度假村中心" ,    "Tags" : [ "酒吧" , "欧陆式早餐" ],     "ParkingInincluded" : "true" ,     "LastRenovationDate" : "2015-09-20T00:00:00Z" ,     "Rating" : 4.80 ,     "Address" : {         "StreetAddress" : “3393 Peachtree Rd”、        “City”:“亚特兰大”、        “StateProvince”:“GA”、        “PostalCode”:“30326”、        “Country”:“美国”         }     }]

现在将这些文档推送到语义搜索索引。

try:    result = search_client.upload_documents(documents=documents)    print("Upload of new document succeeded: {}".format(result[0].succeeded))except Exception as ex:    print (ex.message)

与 OpenAI 集成

让我们建立与 OpenAI 的连接:

question="What is the address of ChatGpt Hotel?"

然后,添加 Azure OpenAI 连接:

纳米搜索 纳米搜索

纳米搜索:360推出的新一代AI搜索引擎

纳米搜索 30 查看详情 纳米搜索

###import osimport requestsimport jsonimport openaios.environ["AZURE_OPENAI_KEY"] = "xxxx"os.environ["AZURE_OPENAI_ENDPOINT"] = "xxxx"openai.api_key = os.getenv("AZURE_OPENAI_KEY")openai.api_base = os.getenv("AZURE_OPENAI_ENDPOINT")openai.api_type = 'azure'openai.api_version = '2023-05-15'# 在 Azure OpenAI Studio > 部署中查找deployment_name = 'gpt-35-turbo'#### 定义一个函数,根据系统消息和消息创建提示def create_prompt(system_message, messages):    prompt = system_message    message_template = "n{}n{}n"    for message in messages:        prompt += message_template.format(message['sender'], message['text'])    prompt += "nassistantn"    return prompt# 定义系统消息system_message_template = "systemn{}n"system_message = system_message_template.format("")print(system_message)

此时,您可以使用语义搜索和 Azure OpenAI。我们来查询语义搜索:

import jsonresults =  search_client.search(search_text=question, include_total_count=True, select='HotelId,HotelName,Tags,Address')=  search_client.search(search_text=question, include_total_count=True, select='HotelId,HotelName,Tags,Address')json_results=""print ('Total Documents Matching Query:', results.get_count())for result in results:    #print("{}: {}: {}".format(result["HotelId"], result["HotelName"], result["Tags"],results["Address"]))    json_results+=str(result)print(json_results)

有了搜索结果,我们现在可以利用 Azure OpenAI 来解释或进一步处理结果。

# 创建消息列表来跟踪对话messages = [{"sender": "user", "text": "Hello, take into account the following information "+json_results},            {"sender": "user", "text": question},            ]response = openai.Completion.create(  engine=deployment_name,  prompt= create_prompt(system_message, messages),  temperature=0.7,  max_tokens=800,  top_p=0.95,  frequency_penalty=0,  presence_penalty=0,    stop=[""])print(response)

此代码向 OpenAI 模型提示搜索结果和我们的原始问题,使其能够根据数据处理并提供有意义的信息。

结论

在本文中,我们了解了如何将 Azure 语义搜索的强大功能与 OpenAI 的功能相结合。通过集成这两个强大的工具,我们可以在我们的应用程序中为用户提供丰富的智能搜索结果。

以上就是利用Azure语义搜索与OpenAI,打造认知搜索系统的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/482350.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 12:01:00
下一篇 2025年11月8日 12:02:19

相关推荐

  • ai做html怎么运行_AI生成html运行步骤【教程】

    答案是使用AI生成HTML代码后,将其保存为.html文件并用浏览器打开即可运行。具体步骤为:1. 在AI工具中输入需求生成HTML代码;2. 将代码复制到文本编辑器并另存为index.html,编码选UTF-8,类型选“所有文件”;3. 双击该文件用浏览器打开,若无法正常显示需检查文件后缀、编码及…

    2025年12月23日
    000
  • 如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

    使用HTML构建标签结构,CSS3添加旋转与过渡效果,JavaScript生成随机HSL颜色并设置字体大小,实现动态交互的标签云组件。 要在网页中实现一个动态的标签云组件,结合 HTML、CSS3 变换和随机颜色生成算法,可以按照以下步骤操作。这个组件不仅能提升页面视觉效果,还能通过色彩和旋转增加交…

    2025年12月23日
    000
  • 如何在Go Gin应用中集成前端JavaScript模块(如Sentry)

    本文探讨了在Go Gin框架下,通过HTML模板服务前端页面时,如何有效集成JavaScript模块(如Sentry)。针对浏览器不直接支持Node.js模块导入语法的问题,文章详细阐述了利用CDN引入Sentry SDK的解决方案,并提供了具体的代码示例,帮助开发者实现前端错误监控功能,避免了复杂…

    2025年12月23日
    000
  • html官网浏览入口_html网站设计免费平台

    html官网浏览入口在https://www.codepen.io,该平台支持实时预览代码、创建Pen项目、Fork开源示例,可添加外部资源,具备点赞评论收藏等社区互动功能,设有挑战活动与作品集分类,开放API接口,界面简洁适合初学者,在线编写无需配置环境,支持多种预处理器和响应式测试。 html官…

    2025年12月23日
    000
  • html如何修改日期样式

    在html中,可以使用“::-webkit-datetime-edit”伪元素选择器来修改日期格式,只需要用该选择器选中元素,在设置具体样式即可,具体语法为“::-webkit-datetime-edit{属性:属性值}”。 本教程操作环境:windows7系统、CSS3&&HTML…

    2025年12月21日
    100
  • 单选框的type属性值为什么

    单选框的type属性值为“radio”。html type属性可以规定要显示的输入框“”元素的类型;值为“radio”时显示为单选框、“checkbox”时显示为复选框、“select”时显示为下拉式选框等等。 本教程操作环境:windows7系统、HTML5版、Dell G3电脑。 在HTML中,…

    2025年12月21日
    000
  • HTML中type是什么意思

    在HTML中,type是类型的意思,是一个标签属性,主要用于定义标签元素的类型或文档(脚本)的MIME类型;例在input标签中type属性可以规定input元素的类型,在script标签中type属性可以规定脚本的MIME类型。 本教程操作环境:windows7系统、html5版、Dell G3电…

    2025年12月21日
    000
  • HTML中ul标签如何去掉点?HTML无序列表的样式实例解析

    本篇文章主要讲述的是关于html中的ul标签的默认小点给取消掉,还有关于html的无序列表ul标签的样式解释,给出了ul标签中的type属性三种值的介绍。现在就让我们一起来看本篇文章吧 首先这篇文章一开始我们就开始介绍在html中是怎么把ul标签的点给去掉的: 大家应该都使用过ul无序列表标签,ul…

    2025年12月21日 好文分享
    000
  • html中的ol标签如何去掉标号呢?标签的使用方法总结

    本篇文章介绍了html的ol标签是怎么去掉序号标号的,这里还有代码的详细解释,还有介绍了关于html ol有序列表标签如何更改序号,下文介绍了三种序号,大家也可以自己去想填写怎样的序号。现在来看这篇文章吧 一、我们先看看html中的ol标签是如何去掉标号的呢: 我们都知道html的ol标签是个有序列…

    2025年12月21日 好文分享
    000
  • HTML ul标签的什么意思?HTML ul标签的作用详解

    本篇文章主要的为大家讲解了关于html ul标签的三种重要的用法,还有关于html ul标签的解释,包含li标签的还有type属性对ul标签的使用情况,好了,下面大家一起来看文章吧 首先让我们先来解释一下HTML ul标签的意思: ul标签定义的是表格当中无序列表,表格当中的无序列表都是在 标签之中…

    2025年12月21日
    000
  • javascript框架和库是什么_如何选择React、Vue或Angular?

    JavaScript框架与库分别提供按需调用的功能集合和约束性开发结构;React是UI组件库,生态灵活但需自行整合工具;Vue渐进式易上手,兼顾原型与工程化;Angular是全功能TypeScript框架,适合强规范企业级项目。 JavaScript框架和库是封装好的代码集合,用来简化前端开发——…

    2025年12月21日
    000
  • React应用生产环境环境变量配置深度指南

    本文针对react应用在生产环境中无法读取`.env`文件配置的环境变量问题,深入剖析其工作原理、常见原因及排查方法。通过详细的步骤和示例代码,指导开发者正确配置和使用环境变量,解决api调用层面的`null`响应问题,确保应用在生产环境下的稳定运行。 在React应用开发中,环境变量(如API密钥…

    2025年12月21日
    000
  • p5.js中类方法声明的语法解析与常见错误修复指南

    本文旨在解决从java processing迁移至p5.js时常见的语法错误,特别是类内部方法声明不当引发的问题。我们将深入探讨javascript中全局函数与类方法声明的语法差异,提供清晰的示例代码,并指导如何识别和修复“unexpected token”及“declaration or stat…

    2025年12月21日
    000
  • p5.js中类方法声明的语法修正与迁移指南

    本文深入探讨了将Processing/Java代码转换为p5.js时,因JavaScript类方法声明语法差异而引发的常见错误。我们将重点解析`Unexpected token`和`Declaration or statement expected`等错误信息,明确全局函数与类成员方法在JavaSc…

    2025年12月21日
    000
  • JS注解怎么实现文档化_ JS注解生成开发文档的流程与工具

    JSDoc是一种JavaScript结构化注释规范,通过@param、@returns等标签描述代码元素,并借助工具生成HTML文档,结合IDE支持和CI/CD可提升团队协作效率。 JavaScript本身不支持原生注解(Annotation)像Java那样的语法,但通过约定的注释格式和配套工具,可…

    2025年12月21日
    000
  • TypeScript泛型函数中复杂对象结构类型推断的精确控制

    本文探讨了在typescript中处理复杂嵌套对象结构时,如何为泛型函数实现精确的类型推断。通过一个具体的汽车品牌和车型数据场景,我们分析了`object.values`等操作可能导致类型信息丢失的问题。核心解决方案是利用映射类型(mapped types)重构数据结构,以显式地建立泛型键与对应值之…

    2025年12月21日
    000
  • JS注解怎么标注联合类型_ JS联合类型的注解书写与使用技巧

    在JavaScript中可通过JSDoc使用联合类型注解,如string|number表示多类型支持,结合@param、@typedef等标签提升代码可读性与编辑器提示,适用于函数参数、返回值等场景。 在JavaScript中,虽然原生不支持类型注解,但在使用JSDoc配合现代编辑器(如VS Cod…

    2025年12月21日
    000
  • VS Code主题开发:告别JSON,拥抱脚本化生成

    vs code主题扩展最终需json格式定义,但开发者可通过javascript或typescript等脚本语言生成此json文件。这种方法有效解决了大型json文件难以维护、不支持注释等问题,并能实现颜色动态计算,显著提升主题开发的灵活性与效率。 为什么选择脚本化生成VS Code主题? 在开发V…

    2025年12月20日
    000
  • 解决 ChatGPT 扩展选择器失效问题:一个实战教程

    本文旨在帮助开发者解决 ChatGPT 网页更新导致扩展选择器失效的问题。通过分析问题原因,提供利用开发者工具查找新选择器的方法,并展示了使用 getElementsByClassName() 替代 querySelector() 的解决方案,以确保扩展功能在 ChatGPT 最新版本中正常运行。 …

    2025年12月20日
    000
  • ChatGPT 扩展失效:定位新版选择器并修复

    本文旨在帮助开发者解决因 ChatGPT 网页更新导致扩展失效的问题。通过分析失效原因,提供利用开发者工具定位新版选择器的实用方法,并给出示例代码,帮助开发者快速修复扩展,恢复其功能。 当 ChatGPT 网页更新时,依赖于特定 CSS 选择器的扩展程序可能会失效。这通常是因为网页结构的改变导致原有…

    2025年12月20日
    000

发表回复

登录后才能评论
关注微信