用搜索增强生成技术解决人工智能幻觉问题

作者| rahul pradhan

来源| https://www.infoworld.com/article/3708254/addressing-ai-hallucinations-with-retrieval-augmented-generation.html

人工智能有望成为当代最具影响力的技术。最近在transformer技术和生成式人工智能方面取得的进展已经展示了其大规模释放创新和独创性的潜力。

然而,生成式人工智能并非没有挑战——这些挑战甚至可能会严重阻碍这一变革性技术的应用和价值创造。随着生成式人工智能模型的复杂性和能力不断提高,它们也带来了独特的挑战,包括生成不基于输入数据的输出

这些所谓的 “幻觉 “是指模型产生的输出结果虽然连贯,但可能脱离了事实或输入背景。本文将简要介绍生成式人工智能的变革性影响,审视该技术的不足和挑战,并讨论可用于缓解幻觉的技术。

生成式人工智能的变革效应

重新表述为:生成式人工智能模型利用深度学习这一复杂计算过程来识别大量数据集中的模式,并利用这些信息创造出新的、令人信服的输出。这些模型采用了机器学习技术中的神经网络,其灵感源自于人脑处理和解释信息的方式,并随着时间的推移不断学习进步

OpenAI的GPT-4和谷歌的PaLM 2等生成式人工智能模型有望在自动化、数据分析和用户体验方面带来创新。这些模型可以编写代码、总结文章,甚至帮助诊断疾病。然而,这些模型的可行性和最终价值取决于它们的准确性和可靠性。在医疗保健、金融或法律服务等关键领域,准确性的可靠性至关重要。但对于所有用户来说,要充分发挥生成式人工智能的潜力,就必须解决这些挑战

大型语言模型的缺点

LLM 从根本上说是概率性和非确定性的。它们根据下一个特定词序出现的可能性生成文本。LLM 没有知识概念,完全依赖于通过训练有素的数据语料库作为推荐引擎进行导航。它们生成的文本一般遵循语法和语义规则,但完全以满足与提示的统计一致性为基础。

LLM 的这种概率性质既是优点也是缺点。如果目标是得出正确答案或根据答案做出关键决定,那么幻觉就是不好的,甚至会造成损害。然而,如果目标是创造性的努力,那么可以利用 LLM 培养艺术创造力,从而相对较快地创作出艺术作品、故事情节和剧本。

AI建筑知识问答 AI建筑知识问答

用人工智能ChatGPT帮你解答所有建筑问题

AI建筑知识问答 22 查看详情 AI建筑知识问答

然而,无论目标如何,无法信任 LLM 模型的输出都会造成严重后果。这不仅会削弱人们对这些系统能力的信任,还会大大降低人工智能对加速人类生产力和创新的影响。

最终,人工智能的好坏取决于它所训练的数据。LLM 的幻觉主要是数据集和训练的缺陷造成的,包括以下方面:

过度拟合: 当模型对训练数据(包括噪声和异常值)的学习效果太好时,就会出现过度拟合。模型的复杂性、训练数据的噪声或训练数据的不足都会导致过度拟合。这会导致低质量的模式识别,使模型无法很好地泛化到新数据中,从而导致分类和预测错误、与事实不符的输出、信噪比低的输出或完全的幻觉。 数据质量: 用于训练的数据的错误标记和错误分类可能在幻觉中起重要作用。有偏差的数据或缺乏相关数据实际上会导致模型输出结果看似准确,但可能被证明是有害的,这取决于模型建议的决策范围。 数据稀缺: 数据稀缺或对新鲜或相关数据的需求是导致幻觉并阻碍企业采用生成式人工智能的重要问题之一。使用最新内容和上下文数据刷新数据有助于减少幻觉和偏见。

解决大型语言模型中的幻觉

有几种方法可以解决 LLM 中的幻觉问题,包括微调、提示工程和检索增强生成 (RAG) 等技术。

微调是指使用特定领域的数据集重新训练模型,以便更准确地生成与该领域相关的内容。然而,重新训练或微调模型需要较长的时间,此外,如果不持续训练,数据很快就会过时。此外,重新训练模型也会带来巨大的成本负担。 提示工程旨在通过在输入中提供更多描述性和说明性特征作为提示,帮助 LLM 得出高质量的结果。为模型提供额外的上下文并使其立足于事实,这样就能降低模型产生幻觉的可能性。 检索增强生成(RAG)是一种侧重于用最准确、最新的信息为 LLM 提供基础的框架。通过实时向模型提供来自外部知识库的事实,可以改善 LLM 的响应。

检索增强生成和实时数据

检索增强生成是提高大型语言模型准确性的最有前途的技术之一。事实证明,RAG 与实时数据相结合可大大减轻幻觉。

RAG通过利用最新的专有数据和上下文数据,使企业能够利用LLM。此外,RAG还能够利用特定语境信息丰富输入内容,从而帮助语言模型生成更准确、与语境更相关的响应。在企业环境中,微调往往是不切实际的,但RAG提供了一种低成本、高收益的替代方案,可用于提供个性化、信息灵通的用户体验

为了提高 RAG 模型的效率,有必要将 RAG 与可操作的数据存储结合起来,该数据存储能够以 LLMs 的母语存储数据,即被称为嵌入的高维数学向量,用于编码文本的含义。当用户提出查询时,数据库会将其转换为数字向量。这样,无论是否包含相同的术语,都可以通过向量数据库查询相关文本。

高可用性、高性能、能够使用语义搜索存储和查询海量非结构化数据的数据库是 RAG 流程的关键组成部分。

以上就是用搜索增强生成技术解决人工智能幻觉问题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/474726.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 08:53:23
下一篇 2025年11月8日 08:58:18

相关推荐

  • php如何生成一个验证码图片?php GD库生成图形验证码教程

    图形验证码通过PHP结合GD库生成,核心是创建图片、绘制随机字符与干扰元素,并将字符存入Session用于验证。 图形验证码,这个在互联网世界里既熟悉又让人有点烦躁的小东西,它的核心作用无非是想区分你究竟是人还是机器。PHP结合GD库来生成这类图片,其实是个挺经典也相当实用的场景。它不像那些复杂的机…

    2025年12月12日
    000
  • PHP源码AI算法嵌入_PHP源码AI算法嵌入详解

    PHP源码AI算法嵌入是通过PHP调用预训练模型或AI服务实现智能功能;2. 常用方法包括PHP调用Python脚本或云AI API;3. 算法选择需根据分类、回归、聚类或NLP等需求确定;4. 实践中可用exec()执行Python预测脚本并返回结果;5. 性能优化可通过数据压缩、缓存、异步处理和…

    2025年12月12日
    000
  • PHP框架在人工智能应用开发中的作用

    php 框架在人工智能应用开发中的作用:优势:模块化设计,轻松集成 ai 组件。可扩展性,应对需求增长。社区支持,提供广泛资源。实战案例:构建聊天机器人,展示框架的应用。使用 laravel 框架集成 tensorflow 服务。训练聊天机器人模型,响应用户输入。结论:php 框架使 ai 应用程序…

    2025年12月12日
    000
  • 什么是PIEVERSE币?值得购买吗?PIEVERSE主要功能、运作方式及代币经济学

    Binance币安 欧易OKX ️ Huobi火币️ 摘要 Pieverse旨在重新定义数字经济中的时间估值和货币化。总供应量为10亿枚PIEVERSE代币,目前流通量为1.75亿枚。24小时交易量为9,654.2619万美元,仅在CoinEx上交易。主要功能包括质押、治理和生产力目标奖励。最近的合…

    2025年12月12日
    000
  • Daeler Node (DNODE) 币是什么?如何运作?2026–2030年价格预测

    加密货币和人工智能的世界正在快速演变,dealer node (dnode) 已成为最令人瞩目的新基础设施解决方案之一。 Binance币安 欧易OKX ️ Huobi火币️ 与其提供另一个区块链、代币或模糊承诺的L2,DNODE更专注于一些非常实用的东西:去中心化运算,这开发者和自主代理可以立即使…

    2025年12月12日
    000
  • 2025年12月有望爆发的6大AI Meme(迷因)币详细介绍

    ai meme币已从一个有趣的利基市场发展成为加密市场中最不可预测的类别之一。过去忽视 meme币的交易者现在正密切关注,因为市场行为不再像一个笑话,而更像一个快节奏的趋势实验室,几乎每周都会形成新的叙事。 Binance币安 欧易OKX ️ Huobi火币️ 整个AI meme领域目前的市值已轻松…

    2025年12月12日
    000
  • 哪些主流交易所才是真正安全的?2025年最安全可靠的5家交易所

    Binance、OKX、Coinbase、Kraken和KuCoin五家平台在监管合规、资产储备证明和技术防护方面表现突出:Binance设SAFU基金并用默克尔树公示储备;OKX提供可验证的PoR系统及混合存储技术;Coinbase严守美国合规并为线上资产投保;Kraken以第三方审计和安全文化著…

    2025年12月12日
    000
  • 割韭菜庄家如何操作?拉盘、砸盘、洗盘逻辑及背后操作手法

    尤其在一些市场中,部分不法分子利用信息不对称和资金优势,通过一系列操作手法来获取不当利益。这些手法通常包括拉高资产价格以吸引追风者,随后又迅速抛售,导致价格暴跌,令跟风者蒙受损失。理解这些操作背后的逻辑和具体手法,对于保护个人资产、理性参与市场至关重要。本文将深入探讨这些所谓的“庄家”如何通过拉盘、…

    2025年12月12日
    000
  • 才刚卖币套现!罗伯特清崎又喊:世纪大崩盘来袭、点名4大保命资产

    畅销理财书籍《富爸爸,穷爸爸》的作者罗伯特·清崎(robert kiyosaki)再次发出强烈警示,宣称他多年来一直预言的“史上最大崩盘”正在逐步成形。尽管他不久前才在高位卖出部分比特币实现盈利,但他仍坚定呼吁投资者应把握时机,积极囤入具备抗风险能力的优质资产,以应对即将到来的全球经济巨震。 Bin…

    2025年12月12日
    000
  • Irys(IRYS)币是什么?未来潜力如何?IRYS代币经济,空投领取与价格预测

    它是一条layer-1 数据链,旨在通过结合去中心化存储、数据可用性和 evm 兼容的执行环境,使链上数据可编程。 这使得智能合约能够高速读取和处理存储的数据,从而在人工智能、授权许可和可验证数据应用领域开辟新的用例。借助这种模式,该平台将自身定位为一个网络,在这个网络中,数据不再是被动的有效载荷,…

    2025年12月12日 好文分享
    000
  • Datagram Network (DGRAM)币是什么?去中心化基础设施网络的未来

    datagram network(dgram)是一个layer 1区块链网络,致力于为web3、人工智能、物联网等应用场景提供低延迟、高吞吐量和全球互联互通。该项目通过其创新的“hyper-fabric”网络架构,结合去中心化物理基础设施网络(depin),实现了高效的节点配额和跨链互操作性。本文将…

    2025年12月12日
    000
  • Fetch.ai (FET) 币是什么?FET未来增长潜力及价格展望

    Binance币安 欧易OKX ️ Huobi火币️ 1. Fetch.ai是什么? Fetch.ai (FET) 是一个结合人工智能 (AI) 和区块链的项目,旨在创建一个由“自主经济代理”(AEA) 分析数据并执行交易的系统。该项目的内核在于,由人工智能代理而非人类代表他人执行经济活动。例如,这…

    2025年12月12日
    000
  • Astra Nova(RVV)币是什么?如何运作?代币经济学、未来展望解析

    游戏、人工智能(ai)与数字资产所有权正在以前所未有的速度融合,而由沙特阿拉伯 rogue sentinel studios开发的 astra nova 正站在这场变革的中心。作为下一代 ai 娱乐生态,astra nova 将沉浸式 rpg 游戏玩法、互动漫画、动态叙事以及现实世界奖励融合为一个互…

    2025年12月12日
    000
  • 一文详细了解以太坊(ETH)的下一个十年:从可验证计算机到互联网产权

    Binance币安 欧易OKX ️ Huobi火币️ 在以太坊 Devconnect ARG 上,LambdaClass 创始人 Fede 发表了一场激情澎湃且发人深省的演讲。他摒弃了传统的「世界计算机」叙事,将以太坊重新定义为人类历史上第一台「可验证计算机」。Fede 认为,这种不依赖信任、仅基于…

    2025年12月12日
    000
  • AgentLayer (AGENT) 币是什么?如何运作?代币经济学、价格分析

    随着自动化代理和大型语言模型(llms)的兴起,人工智能领域正迈入一个新时代。这些ai 代理人不再是被动工具。相反,它们作为独立系统,能够进行推理、决策,并以最小的人类介入运行复杂任务。这一转变对于新用户提出了一个关键问题:agentlayer是什么,为什么它正成为代理型ai经济的基础层? Bina…

    2025年12月12日
    000
  • 比特币(BTC)重返9万美元后能否开启圣诞行情?一文了解

    不管是老中还是老外,都逃不过一个「好好团圆过节」的传统心理。每年 11 月的第四个星期四,是美国传统的重大节日感恩节。 Binance币安 欧易OKX ️ Huobi火币️ 而今年的感恩节,币圈人最想感恩的可能是比特币重回了 9 万美元。 除了「节日行情」的因素影响,一份因政府停摆而意外成为关键决策…

    2025年12月12日
    000
  • 加密货币市场分析:未来趋势与潜在机会

    加密货币市场正迈向成熟,2025年呈现三大趋势:一是Layer 2与模块化区块链普及,提升可扩展性;二是AI与区块链融合,推动智能治理与去中心化算力发展;三是实体资产代币化(RWA)加速,增强传统资产流动性。宏观环境趋稳,机构资金涌入,多链生态形成良性竞争。未来机会集中于跨链互操作、去中心化身份、创…

    2025年12月11日
    000
  • 什么是币安币(BNB)?BNB价格预测2025-2030年

    币安币(BNB)是币安平台发行的功能型代币,最初为ERC-20代币,后迁移至自主开发的BNB链,成为生态系统的核心燃料。BNB主要用途包括支付交易手续费折扣、作为BNB链的Gas费、参与币安Launchpad和Launchpool等平台活动,以及在越来越多的线上线下场景中作为支付工具。为增强其价值,…

    2025年12月11日
    000
  • 2025年新的加密货币有哪些种类一览

    随着数字资产领域的不断演进,2025年的市场将迎来更多与现实世界应用紧密结合的创新项目。这些新兴种类不再局限于简单的价值存储或交易媒介,而是旨在解决特定行业的问题,并推动技术融合。了解这些前沿趋势,对于把握未来机遇至关重要。 欧易官网入口: 欧易APP下载链接: 币安官网入口: 币安APP下载链接:…

    2025年12月11日
    100
  • Holoworld AI(HOLO)是什么币?怎么买?未来能涨到多少

    Holoworld AI(HOLO)是AI驱动虚拟社交平台的原生代币,用于生态内功能与激励。用户可通过中心化平台(如用USDT交易)或去中心化平台获取HOLO,需注意合约地址准确性与网络手续费。其市场表现受项目团队、技术进展、代币经济模型、市场环境及社区活跃度等多重因素影响,且所有数字资产交易均伴随…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信