AI Agent在企业级设计中的思考方式

在今年大型模型的爆发之后,目前的人工智能技术仍处于第二代系统阶段,并尚未达到人工通用智能(AGI)的水平。不过,在一些领域中,已经可以利用AI Agent进行处理。作为典型的B端方向应用,如何设计符合业务需求的AI Agent呢?

随着人工智能的迅猛发展,各种先进的大型模型、产品和工具层出不穷。作为一名b端产品经理,我们需要积极 embrace 这种变革的人工智能技术,并将其应用于我们自身的业务,以确保企业的效率不会落后于行业的发展

一般来说,如果企业没有自主研发大型模型,就需要依赖第三方的大型模型能力来开发AI能力,从而构建适用于企业自身的AI产品或工具。

如下图所示,常见的大型模型方向包括自然语言处理(NLP)、多模态(multimodal)和语音识别。大型模型厂商基于特定方向的能力进行AI训练,从而使得AI能够在某些领域上替代人类进行“可重复的”和“可标准化的”任务。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

浅谈AI Agent在B端的设计思路

图片引用于开放隐私计算的《百模大战!AI大模型你更看好哪一家?》

为了确定我们业务所需的AI能力,我们需要对相应的AI模型进行调研,并评估大型模型的输出能力。我们可以从召回率、准确率、安全性、可解释性、稳定性、成本和发展潜力等多个维度对大型模型进行评估,以最终选择适合我们需求的大型模型。关于这一主题,我在之前的文章中有详细介绍如何选择适合自己的大型模型。

然而,当前的AI技术仍处于第二代系统阶段,尚未达到AGI水平。目前可接入的大型模型仍存在一些问题,主要包括以下几个方面:

1. AI幻觉:

AI幻觉是指人工智能在知识记忆、理解能力、训练方式和模型技术等方面存在的限制,导致其在输出结果时表现不准确或不可靠。常见的问题包括数据偏见和解释性差

由于AI幻觉的存在,即使我们期望AI能够稳定输出可靠的解决方案,仍然会有一定比例的错误答案产生。例如,如果AI在某个领域的准确率为50%,那么在50个答案中会有25个错误答案。对于需要高精确度的业务来说,AI无法直接应用。

2. 合规问题的答案

AI的本质是基于统计学的结果预测,缺乏明确的是非判断能力。因此,在涉及道德、法律等问题时,AI无法进行准确的判断或区分,可能对企业带来负面影响

3. 不够原生:

当前,人工智能的交互方式主要是通过输入-输出进行的。用户输入内容,人工智能输出结果。然而,这个过程并不适合所有业务人员的使用习惯

以翻译场景为例,翻译人员的业务流程通常包括以下几个步骤:

确定翻译需求:确认翻译的源语种、目标语种、翻译风格以及不同地区的文化差异和调整方案等内容。 批量执行翻译:翻译任务通常涉及多条内容,翻译人员需要在同一时间内批量完成处理。 校对:翻译完成后,需要由校对人员进行校对,判断是否符合业务需求。 修改:如果翻译结果不符合需求,则需要进行修改。修改完成后,继续进行翻译、校对和修改的流程,直到修改通过。 交付:将通过校对的内容应用到业务中。

然而,如果要使用AI进行翻译,以节省人力成本,直接使用大型语言模型的对话输入交互方式会带来以下问题:

1)中断现有的工作流程,难以培养使用习惯:

使用大型语言模型的对话窗口会打断原有翻译工作的业务流程。原本只需要在翻译工具或文档上完成工作,加入大型模型对话后,每个翻译文本都需要在输入框上进行输入交互。

2)操作成本增加的上限问题:

大型语言模型存在对话长度的限制,如果翻译内容量很大,就需要分批次进行交互,这会增加人力成本。

3)满足特殊翻译需求的操作成本增加:

如果存在特定的翻译需求,比如术语翻译或指定翻译风格,每次都需要进行交互,这进一步占用人力。

以上问题导致AI无法有效提高业务的翻译效率。由于操作繁琐,用户很难形成使用习惯,他们往往会下意识地认为直接自己翻译比使用AI更好,因此替换成本较高。

此外,AI翻译存在幻觉问题,无法提供超出预期的用户体验。

由此,【(新体验-旧体验)-替换成本】 并没有大于0,直接使用 AI 的原生的交互方式并不能有效地提高业务率,因此需要一些更 native 的方式。

浅谈AI Agent在B端的设计思路

一、什么是AI Agent

鉴于目前人工智能面临的挑战,我们需要思考如何在B端建设我们自己的应用。其中一种可行的方式是尝试构建专为业务定制的AI Agent

所谓AI Agent,又称人工智能代理,是指能够理解、学习和执行任务的自动化程序。可以将其比喻为”将AI视为实习生,让其承担琐事,而我们则负责指导这位实习生,确保其产出符合预期的结果”。

与大型模型不同,AI Agent的交互方式并不仅限于与人进行提示。它是一个系统,基于特定的工作目标,并输出符合需求的结果。AI Agent的核心是一个大型模型,同时还包括感知模块、计划模块和行动模块的扩展

浅谈AI Agent在B端的设计思路

创客贴设计 创客贴设计

创客贴设计,一款智能在线设计工具,设计不求人,AI助你零基础完成专业设计!

创客贴设计 51 查看详情 创客贴设计 感知模块:感知模块通过与业务数据源和外部数据源的连接,将数据组装到提示词中以进行输入。 行动模块:行动模块可以通过与业务能力接口的连接,根据感知和规划的结果执行相应的业务操作。另外,还可以通过反馈系统将业务实践中的反馈数据与代码、策略和提示词进行优化。 规划模块:规划模块是AI Agent的核心。除了利用大型模型的能力外,还需要根据业务需求结合代码逻辑进行设计。在这里,我们需要构思大脑的运作方式,并采用适当的输入输出方式来推动业务。 二、如何设计AI Agent

那么怎么设计符合业务需求的 AI Agent ?

1. 找到合适的业务场景

首先,我们需要确定适合AI Agent 的场景,通过模拟数据输入和收集输出结果的方式来评估所选场景的适宜程度。在判断输出结果的同时,需要考察是否符合预期。若结果不符合预期,则需要评估误差的严重程度,以及准确率和召回率是否存在改进空间。若存在改进空间,可以通过优化提示词,或者通过引入感知、行动和规划模块的构建,使得AI符合我们的场景需求。

2. 梳理输入和输出预期

我们需要明确对于AI Agent的’目标’和’要求’,以确定我们输入什么,Agent需要输出什么。

基于这些’目标’和’要求’,我们应该思考如何选择合适的输入输出方式来满足业务需求并为业务赋能。这将有助于我们设计后续的输出流程,并在设计验证阶段进行评估,以确定是否符合要求。

3. 梳理输出流程

当我们面临复杂的输出要求时,需要设计多个AI会话流程,以使各个AI之间相互协作,最终实现符合要求的输出结果。例如,在文本分类场景中,我们可以首先使用3.5版本的大模型进行准确的一级分类,以满足需求。

由于4.0版本的成本是3.5版本的几十倍,而3.5版本在一级分类上已经足够使用,因此可以选择使用3.5版本以节省成本。接着,我们可以使用4.0版本进行二级分类,以获得更好的分类效果,确保我们输出所需的内容。

在设计流程时,需要考虑以下几个因素:

成本因素:不同大模型及其版本的费用各不相同,我们需要权衡业务收益,选择一个合理的大模型使用方案,以避免得不偿失。 效果因素:不同大模型及其版本的效果各有差异,并且在不同领域有其擅长之处。我们需要结合使用需求,选择最适合的方案。

在综合考虑成本和效果的因素后,我们最终确定了一个适合的方案

4. 输出检验机制

为了避免AI输出结果中存在误导性内容对业务产生影响,我们需要建立一套有效的验证机制。常见的验证方法包括词库匹配、正则表达式匹配和人工检验。通过使用词库或人工方式拦截具有误导性的内容。此外,我们还可以构建质检Agent,让AI自身对输出进行质检,以过滤出存在问题的内容,提高误导性内容的检测率。

5. 幻觉兜底方案

幻觉的产生是无法完全根除的现象。为了避免对业务造成不良影响,我们需要制定兜底方案,例如:

1)人工检验:在AI输出传递给用户之前,引入人工检验环节。只有在人工检验通过后,才将结果输出给用户。这样一来,我们能够完美地防止AI幻觉对业务产生负面影响,并且还能够利用AI的输出结果提升效率。然而,这种方法需要人力审核,因此会增加一定的人力成本。

浅谈AI Agent在B端的设计思路

2)合理包装:考虑到我们是面向B端的AI应用,我们可以采用包装输出应用为“AI助手”等方式,直接向用户明确表示:“这里的输出结果由AI生成,仅供参考”。通过这种方式,我们能够让用户形成合理的心理预期,避免在出现幻觉输出时产生不良反应。

三、总结

基于以上思路,我们便可以构建B端的翻译Agent、数据分类Agent、智能客服Agent等等业务了,当然这仅仅是我个人的一些思考,欢迎大家交流讨论。

请给我投票

我在参加人人都是产品经理2023年度评选,希望喜欢我的文章的朋友都能来支持我一下~

点击下方链接进入我的个人参选页面,点击红心即可为我投票。

每人每天最多可投30票,投票即可获得抽奖机会,抽取书籍、人人都是产品经理纪念周边&起点课堂会员等好礼哦!

请点击以下链接进行投票:https://996.pm/7d9yE

专栏作家

柠檬饼干净又卫生,公众号:柠檬饼干净又卫生,人人都是产品经理专栏作家。一名游戏行业的B端产品,负责过游戏行业内CRM 、风控、BI、SDK、AI相关的内容,定期输出个人思考或总结文章~

本文原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unsplash,基于CC0协议

以上就是AI Agent在企业级设计中的思考方式的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/440232.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 18:19:04
下一篇 2025年11月7日 18:23:32

相关推荐

  • Agent Development Kit— 谷歌开源的 AI Agent 开发与部署框架

    agent development kit(adk)是谷歌开源的首个ai智能体开发工具包,这是一个代码优先的python工具包,旨在简化复杂ai代理的构建、评估和部署过程。adk支持多智能体架构,允许开发者构建由多个专业智能体组成的层次化应用,以实现复杂的协调和委派。该工具包提供丰富的工具生态系统,…

    2025年12月4日
    000
  • Parlant— 开源的大模型AI Agent开发框架

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 千帆大模型平台 面向企业开发者的一站式大模型开发及服务运行平台 0 查看详情 Parlant是什么 parlant是开源的llm(大型语言模型)代理行为建模引擎,帮助开发者快速创建符合业务要求的…

    2025年12月4日 科技
    000
  • Magnitude— 开源 AI Agent 驱动的端到端测试框架

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 白瓜面试 白瓜面试 – AI面试助手,辅助笔试面试神器 40 查看详情 magnitude 是一种开源的、由视觉 ai agents 驱动的端到端测试框架。它通过自然语言构建测试用例…

    2025年12月4日 科技
    000
  • 智现未来完成数亿元A轮融资,推进人工智能在半导体制造领域的创新发展

    近日,无锡智现未来科技有限公司(以下简称“智现未来”)宣布完成了数亿元的a轮融资。本轮融资由国投创业和梁溪科创母基金(博华资本)联合领投,武汉江夏科投跟投。据了解,智现未来将利用这笔资金进一步巩固在设备监测、分析建模、工艺控制和良率改进等领域的领先地位,重点推动生成式人工智能技术在半导体制造全流程中…

    2025年12月2日
    000
  • Shutterstock图片怎么用于教育课件_Shutterstock教育素材下载与版权规范

    可以,Shutterstock图片可用于教育课件,但需遵守标准授权条款,限于非盈利教学场景。使用时应避免商业传播、保留授权证明,并推荐标注来源以培养版权意识。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在制作教育课件时,使用高质量图片能…

    2025年12月2日 科技
    000
  • Shutterstock水印怎么去除_Shutterstock官方去水印购买与下载流程

    唯一合法去除Shutterstock水印的方法是通过官方购买授权。用户需访问官网选择订阅或单张购买,登录后搜索并添加图片至购物车,完成支付即可下载无水印高清图。非官方工具去水印属盗版行为,存在法律、安全与画质风险。为合法经济使用图片,可选用Unsplash、Pexels等免费图库,评估需求后选择单次…

    2025年12月2日 科技
    000
  • 贾跃亭:Super One进入批量生产阶段 双上市体系建成

    11月24日,faraday future(ff)创始人贾跃亭在其个人周报中透露,由其掌控的第二家美股上市公司aixcrypto holdings inc.已顺利完成在纳斯达克的更名挂牌程序,此举标志着ffai与aixc“双飞轮、双桥梁、双上市”战略架构的全面落地。这是自2021年ff登陆纳斯达克之…

    2025年12月2日 科技
    000
  • Claude 4.5杀疯了!成本砍掉三分之二,连GPT都得靠边站?

    最近连续被gpt-5.1、gemini 3 pro持续刷屏,感觉anthropic再不刷点存在感,大家都忘记claude这个模型的存在了。这不claude opus 4.5新鲜出炉。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 其实总结下…

    2025年12月2日 科技
    100
  • 亚马逊云科技宣布推出生成式AI新服务加速创新

    ○ 亚马逊云科技全托管生成式AI服务Amazon Bedrock现已正式可用。客户可以使用来自众多领先AI公司的高性能基础模型,以及构建生成式AI应用程序所需的一系列功能,在简化开发过程的同时确保隐私和安全; Amazon Bedrock新增Amazon Titan Embeddings和Meta …

    科技 2025年12月1日
    000
  • 「天工大模型3.0」4月17日正式发布——同步开源4000亿参数MoE超级模型,性能超Grok1.0

    ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路。 在即将到来的2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0…

    2025年12月1日 科技
    000
  • LazyCraft— 开源的 AI Agent 应用开发与管理平台

    LazyCraft是什么 lazycraft 是一个开源的 ai agent 应用开发与管理平台,由商汤科技基于其自主研发的开源框架 lazyllm 打造。该平台致力于降低大模型应用的开发门槛,帮助开发者以更低的成本快速构建、部署和运维大模型驱动的应用程序。lazycraft 提供从应用创建、调试、…

    2025年12月1日 科技
    000
  • ​数字化转型升级之工业元宇宙与AIGC

    原子世界可以被看作是元宇宙的一个维度,它将人们的认知从单一维度扩展至多维度。AIGC是一种高度智能化的搜索引擎,具备快速查询和整合大量信息的能力。新兴技术,如元宇宙和AIGC,将使人类社会在数字化转型升级方面更深入、更全面。本文探讨了工业元宇宙与AIGC相关内容,一起来看一下吧。 ☞☞☞AI 智能聊…

    2025年12月1日 科技
    000
  • AI行业应用:数据编织助力AI应用训练突破

    #本文为人人都是产品经理《原创激励计划》出品。 尽管大型AI模型现在非常受欢迎,每个企业都想在其中分一杯羹,但实现这一过程所涉及的算法和数据并不是易如反掌的。其中,数据的传输和管理是个大问题。本文围绕AI应用训练的瓶颈展开叙述,对AI训练难点进行总结并结合IDC分析报告,得出“数据”是最大瓶颈的结论…

    2025年12月1日 科技
    000
  • 讯飞星火,AI燎原or熄灭?

    本篇文章作者将从文本、问答、翻译、逻辑、代码编写和计算能力等几个方面,对比讯飞星火和ChatGPT两个应用的差别 ,希望这篇文章能对你有所帮助。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 讯飞星火6月9日迭代在即,一起来看看它是否能成为…

    2025年12月1日 科技
    000
  • 三个关键技术给予AR界面的力量

    本篇文章将从技术角度出发,并以最近推出的苹果MR为例,分析AR世界里所需要依托的三个关键技术点:眼动追踪、手动识别和空间计算。让我们一起看看作者对这三个技术点的分析吧~ ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在物理世界中,用眼观察、…

    2025年12月1日 科技
    000
  • LangGraph WhatsApp Agent— 用于构建与 WhatsApp 用户互动的 AI Agent

    langgraph whatsapp agent 是一个基于 langgraph 和 twilio 构建的开源项目,用于开发与 whatsapp 用户互动的 ai agent。这个项目支持多代理架构和图谱处理,能够处理文本和图像消息,并保持持久化的对话状态。项目集成了 model context p…

    2025年12月1日
    000
  • 复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

    近期,复旦大学自然语言处理团队(FudanNLP)推出 LLM-based Agents 综述论文,全文长达 86 页,共有 600 余篇参考文献!作者们从 AI Agent 的历史出发,全面梳理了基于大型语言模型的智能代理现状,包括:LLM-based Agent 的背景、构成、应用场景、以及备受…

    2025年12月1日 科技
    000
  • 全面超越AutoGPT,面壁智能联合清华NLP实验室开源大模型「超级英雄」XAgent

    近日,国内领先的人工智能大模型公司面壁智能又放大招,联合清华大学 NLP 实验室共同研发并推出大模型「超级英雄」——XAgent。 通过任务测试,XAgent 在真实复杂任务的处理能力已全面超越 AutoGPT。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek…

    2025年12月1日 科技
    000
  • AI正在改写规则,传统行业如何翻盘?

    随着科技的发展,AI技术占据了市场大半个地位,这种情况下不得不思考,传统行业该如何自处呢?下面这篇文章是笔者整理分享的关于传统行业要如何调整好AI浪潮带来的冲击。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 在数字化的时%ignore_a…

    2025年12月1日 科技
    000
  • 巨人网络在云栖大会上展示首批融合游戏和人工智能的创新成果

    11月2日消息,巨人网络首批“游戏+ai”成果在杭州云栖大会上亮相,该公司ai实验室负责人丁超凡在论坛中分享了该项目成果,游戏整体研发效率获大幅提升。公司“游戏+ai”的目标是革新游戏生产、推动玩法创新。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 …

    2025年12月1日 科技
    000

发表回复

登录后才能评论
关注微信