突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent

今年 3 月份,我们还在以为 ai agent 的新纪元需要等到“泛 agi”,依靠大模型自身的能力和与之相辅相成的一系列技术的发展,诸如 rag、调用链等,去将大模型的能力更深入地“外置”给 agent 单元体。

然而到了下半年,随着大模型自身推理能力的爆发,以及生态中 MCP、ACP、A2A、上下文工程等技术基础设施的演进,“推理 Agent 元年”已然到来,Agentic AI 这种模式也已经能够较为通畅地应用到了各种各样的行业、产品、任务中,比如大家最熟悉的 AI Coding 工程化

正是在这样快速演进的时代,Agent 正成为下一轮智能革命的关键力量。它不仅能理解人类意图,更能自主规划任务、调用工具、执行复杂目标。这一跃迁,正在重塑生产力体系、企业组织形态以及软件开发的底层范式。

重读 3 月份的这篇文章,多少还是有点意思,也不算过时,毕竟观点似乎还是赌对了。只是没有料想到 AI 生态的发展,过于快速了。

再把这篇文章的话题拿出来聊聊吧,也为 全球开源技术峰会 GOTC 2025 作一下预热宣传。刚好李开复会在活动主论坛上发表关于“从 ChatBot 到 Agent 的跃进与机会”的主题演讲,并发布他们零一万物的新 Agent 平台

李开复大家应该都知道,零一万物 CEO、创新工场董事长,作为人工智能技术演进与产业化的重要推动者,李开复长期致力于推动 AI 从单纯的能力积累向实际价值创造转型。他在多个场合指出,随着推理模型的发展,生成式 AI 正逐步迈入具备自主规划与执行能力的 Agent 智能体时代。

李开复将 2025 年称为“推理 Agent 元年”,他认为,推理 AI Agent 浪潮为中国企业的数智化转型与组织升级提供了重要机遇,它不仅能够重塑生产方式和业务流程,也可能成为推动下一轮商业智能革的核心引擎。在他看来,企业应将战略设计与 AI 部署紧密结合,通过智能体实现以结果为导向的高效运营,让 AI 的应用价值从单纯降本拓展为全面增效,从而真正释放生成式 AI 与 Agent 技术带来的潜力。

他这次要分享的主题,其实主要也是深度解析生成式 AI 如何从“被动应答”的 ChatBot 时代,跨越到“主动协作、具备目标与执行能力”的 Agent 时代,并分享这一跃进为产业、企业与开发者带来的真实机会与挑战。

观点侧重点在于产业化、时代机遇方面。而我 3 月份这一篇主要侧重在聊产品化相关的方面,结合着参考,到时候去听听李开复怎么说,也看看大家有什么样的机会切入市场,赚到自己的那桶金吧

不过说实在的,个人还是最关注这次 GOTC 的 AI Coding 论坛,他们把阿里 Qoder、百度 Comate、腾讯 CodeBuddy 这几家都拉来了,而且还有我最关注的“AI Coding 工程化”的圆桌讨论,很难相信这个论坛内容质量会差。(也是给他们打这广告的原因)

突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent

以下为原来那篇文章:《大模型产品就这两根道,IM 化(Chat)+管家化(Agent)》

当前大模型产品演进方向无非两个大头:一个是 AI Chat 方向,一个是 AI Agent 方向。

前者主打对话“获取信息”,后者主打“解决问题”。

Chat 方向,要往“IM 化”极致交互体验去做。

Agent 方向,要让 AI 变成你的“管家”,你交待他事情,他负责统筹去搞定之后给你结果。
这是两条完全不同的道路。

当然 Chat 作为 Agent 的一个前端方式,两者自然也是可以协同起来的。

突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent

Agent 这个方向主要是技术层面当前还需要不断演进,但这是一个比较长远的路,或许是所谓的 AGI 要达成的。

AI 只是个 Agent,一个代理,一个特工,帮你搞定不同的事情,所谓丰富多样的“Multi Agents”,而上层对到用户只需要一个“总管”、“管家”来统筹之

其中各种 Agent 具体能力的实现,当然又包含了软件层面和硬件层面,软件层面诸如“Agent 帮我直接完成了一篇图文并茂的论文”,硬件层面主要是“传统硬件驱动”,比如调度显示器、鼠标啥的,与更大头的具身智能方向。具身智能已经自成体系了,具体情况专业人士再去探讨吧,按下不表。

突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent

 

此处点一下“MCP”这个协议,它恰好是实现涉及软、硬件能力 AI Agent 的桥梁,驱动软的又可以驱动硬的,而驱动硬件部分才是我觉得它最牛逼的地方,任督二脉打通之

Agent 方向实际情况来看,当下我们能做的只是去不断补足基础设施的生态,以及能力,比如前边说到的 MCP 这种基础设施,简单讲的话,你看,我为什么说它驱动硬件部分才是最牛逼的地方,就因为它直接体系化地为 Agent 方向引入了调度硬件的能力,开阔了一片天。

至于大模型能力本身,那是另一个大话题,对数据的转化、扩散、对数据的训练、权重、微调、性能调优、GPU 加速、上下文窗口、大模型、小模型、模型“热进化”等等,自不必提,大模型技术专家去探索之。

Type Studio Type Studio

一个视频编辑器,提供自动转录、自动生成字幕、视频翻译等功能

Type Studio 61 查看详情 Type Studio

而大模型这么一个“封闭的黑盒”,我们在演进 Agent 方向,需要找到一个怎样的核心思路呢?

我的抽象提炼是:我们要让人类能更好地参与到大模型封闭黑盒中,也就是输入

包括在基础设施生态层面、在具体技术能力层面、在工程化层面、在流程化层面、在上层产品操作等等层面去输入给大模型。

那么,诸如下边随便列举这些点(当然还有更多,以及后边还会新突破的更多点),本质上都是在往这个方向上叠 buff:Prompt 工程本身、自动化 Prompt 调优、RAG、调用链、rules、function calling / tools、记忆层、MCP、A2A、结构化 JSON 返回、自动化 builder、效果即时预览、可视化编排、多模型调度、任务管理……

再来看看 Chat 方向。这个方向需要往“IM 化”极致交互体验去做。

底层核心理念是这样的:跟 AI Chat 助手对话就和我跟别人进行 IM 聊天是一样的,只不过对面是一个 AI,仅此而已

这个月 7 号我还在跟人聊到 IM 化的话题,16 号腾讯就上线了可以把元宝添加成微信好友的功能,腾讯产品经理还是有点东西的。

突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent

从用户角度来看,将 AI 聊天助手当作人类,深度融入 IM 平台能够带来“便利性”与“熟悉感”的双重红利。

首先,用户无需下载额外应用或跳转界面,就能在日常使用最频繁的聊天工具中直接调用 AI 服务,大大提升了接入效率。

其次,AI 助手以“联系人”形式出现在熟悉的聊天列表中,降低了学习成本,让人仿佛在与朋友对话般自然流畅。

同时,通过持续学习用户的对话习惯与偏好,助手还能提供高度个性化的建议与提醒,并且全天候在线,随时响应用户的需求。

从行业视角来看,IM 平台嵌入 AI 聊天助手不仅是提升竞争力的关键举措,也能开辟全新的生态与商业空间。

一方面,通过丰富平台功能与智能化服务,能够显著提升用户停留时长和活跃度,进而增强用户黏性。

另一方面,AI 与用户的互动数据为产品优化和新业务开发提供了宝贵洞察。

此外,借助 AI 助手拓展文档处理、内容创作、电商推荐等多场景应用,IM 平台可从单一通讯工具升级为综合性数字生活入口,进一步实现高级功能订阅、企业解决方案等商业化变现。

还有一个很重要的是:在当前 AI Chat 产品能力普遍不咋滴的情况下,直接有效复用 IM 那个成熟领域。

对于腾讯来说,首先自然是充分利用了微信超过十三亿日活用户的规模,而背后其实是“在全球范围内,IM 平台用户规模已接近 52 亿”。

元宝 AI 还可以直接整合微信生态资源,比如公众号文章、视频号内容等,进一步双向把微信这个流量入口,这个生态扣得更紧。

这里也再下一个自然而然的预测:企业微信后边会是元宝发力赚钱的大头

但说实在的,目前腾讯这东西离“极致用户体验的 IM 化 AI Chat”还远得很。别的不说,先按微信目前的功能补上来,让元宝真的就像背后是“女装加强版 QQ 马化腾”以假乱真,然后再谈 AI 向的极致用户体验(比如前边扯到的模块化引用之类的东西)。

也必须得说一下,AI Chat IM 化不 IM 化,这个有点见仁见智了,我也说不出个必然要这样的逻辑,只是目前行业 Chat 的产品能力来看,如果像我表达的“像与人类对话一样,自然需要引用功能”,那么 AI Chat 产品形态往 IM 化去做,确实就是存在既有经验的,而且是大量与深入研究过的:照着做 IM 的产品思考,直接把行业关于 IM 产品的思考与能力搞上去再说,多么多快好准。

以上就是突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1172249.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月6日 19:41:55
下一篇 2025年12月6日 19:42:26

相关推荐

  • 抖音开店铺需要交钱吗?需要交多少?2025年开店成本全解析

    在短视频带货热潮席卷市场的今天,抖音平台成为众多商家争抢流量的新战场。然而,“开一家抖音店铺到底要不要花钱?成本有多高?”依然是创业者最关注的核心问题。本文将全面拆解抖音开店的费用结构与降本增效策略,助您科学布局电商版图。 一、抖音开店费用全揭秘 1. 基础门槛:零元入驻,轻松起步 抖音官方明确规定…

    2025年12月6日 自媒体
    000
  • FGO妖精双六4个强化本从者介绍-FGO妖精双六4个强化本都有哪些从者

    FGO妖精双六活动中,国服为四位从者开放了全新的强化本,那么此次获得强化的究竟是哪几位从者呢?接下来就让我们一起来看看这四位从者的具体强化内容与实际表现。 杰罗尼莫本次强化的是其第三技能。原技能中的群体绿卡魔力提升效果调整为仅对单体生效,同时新增减少己方单体1回合技能冷却时间的效果。 从强化方向来看…

    2025年12月6日 游戏教程
    000
  • 如何通过链接在Web页面中打开原生Gmail和Yahoo Mail应用

    本教程旨在指导开发者如何利用uri scheme在html链接中实现直接启动android和ios设备上的gmail和yahoo mail原生应用程序。文章将详细介绍针对不同平台的实现方法,包括android的`intent://`方案和ios的自定义uri,并阐明`mailto:`链接的行为特性、…

    2025年12月6日 web前端
    000
  • Linux如何配置RAID阵列_LinuxRAID阵列配置的详细步骤

    首先安装mdadm工具并确认磁盘,使用mdadm命令创建RAID 1/5阵列,格式化为ext4后挂载,接着将配置写入/etc/mdadm/mdadm.conf,更新initramfs,并在/etc/fstab中添加自动挂载项以确保重启生效。 Linux中配置RAID阵列主要通过mdadm工具实现,结…

    2025年12月6日 运维
    000
  • 解析VSCode嵌入式开发与交叉编译配置

    答案:VSCode通过配置插件、交叉编译器和调试工具实现嵌入式开发。1. 安装C/C++、Cortex-Debug等插件;2. 配置arm-none-eabi-gcc等工具链路径;3. 设置c_cpp_properties.json以支持语法提示;4. 通过tasks.json和launch.jso…

    2025年12月6日 开发工具
    000
  • 88vip淘宝买东西能优惠多少?如何成为88vip呢?88VIP一年能省2000+?3招教你秒变会员,购物直接打95折!

    淘宝88vip到底有多划算?答案令人惊喜——一年轻松省下2000元以上! 从天猫超市全年95折,到限量发放的大额消费券,再到免费畅享优酷或网易云音乐会员,这张会员卡堪称网购达人的省钱利器。但鲜有人知的是,即使淘气值未达1000也能开通,只是价格相差近10倍!本文将全面揭秘88vip的隐藏省钱攻略——…

    2025年12月6日 自媒体
    000
  • iPhone 16 Pro如何查看详细电池信息

    iPhone 16 Pro 查看电池信息可通过系统设置和捷径实现:①在“设置-电池-电池健康与充电”中查看最大容量、峰值性能能力及充电建议;②使用“捷径”添加“iPhone 电池健康度Plus”获取循环次数、设计容量、温度等详细数据;③开启电池百分比显示便于日常使用。系统功能满足基础需求,捷径提供深…

    2025年12月6日 手机教程
    000
  • 瑞达写作官方网站通道口 瑞达写作App官方下载链接点

    瑞达写作官方通道为https://ipapers.net/?df=bi_ls,该平台提供高效初稿生成、智能改稿及文献管理等功能,支持多类论文一键撰写与优化。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 瑞达写作官方网站通道口在哪里?这是不…

    2025年12月6日 科技
    000
  • 使用Express和EJS在独立卡片中展示多数据库内容

    本文详细介绍了如何利用Express框架、EJS模板引擎和Mongoose,从多个MongoDB数据库(或集合)中获取数据,并通过建立数据关联,在前端页面中以独立的HTML卡片形式动态展示图文结合的内容。重点在于后端的数据建模、关联查询以及前端EJS模板中循环渲染的正确实践。 理解需求:多源数据与独…

    2025年12月6日 web前端
    000
  • laravel如何为API请求实现缓存策略_Laravel API请求缓存策略实现方法

    答案:Laravel中可通过Cache Facade、模型作用域、中间件和Redis实现API缓存。使用Cache::remember缓存用户分页数据;在模型中封装高频查询的缓存逻辑;通过中间件统一处理GET接口缓存;推荐Redis驱动提升性能,合理设置过期时间并提供缓存清理机制。 在 Larave…

    2025年12月6日 PHP框架
    000
  • VSCode活动栏面板管理策略

    活动栏位于VSCode左侧,通过自定义布局、隐藏不常用图标(如右键“隐藏”搜索)、调整位置至右侧(修改sideBar.location)及使用快捷键或命令面板快速切换,可显著提升开发效率。 VSCode的活动栏面板是提升开发效率的重要区域,合理管理能让常用功能触手可及,减少操作路径。关键在于根据工作…

    2025年12月6日 开发工具
    000
  • mysql中如何实现增量备份

    MySQL增量备份通过启用二进制日志(log-bin)记录数据变更,先进行全量备份作为基础,随后定期归档或导出binlog文件获取增量数据,恢复时按顺序应用全量备份和增量日志,结合–start-datetime或–stop-datetime可实现时间点恢复,需定期清理旧日志以…

    2025年12月6日 数据库
    000
  • win11怎么修复应用闪退问题_Win11应用闪退问题修复方法

    1、使用兼容性疑难解答自动修复问题,适用于系统版本不匹配导致的闪退;2、通过设置重置应用数据,清除损坏的缓存或配置文件;3、利用PowerShell重新注册Microsoft Store应用包以恢复完整性;4、运行SFC扫描修复受损的系统核心文件;5、更新或回滚显卡驱动程序,解决图形相关应用的兼容性…

    2025年12月6日 系统教程
    000
  • 雷蛇灵刃18对决宏碁掠夺者战斧18:双水冷加持的旗舰游戏本,极致散热下性能释放有多恐怖?

    雷蛇灵刃18和宏碁掠夺者战斧18均采用创新散热技术实现顶级性能释放,前者使用大面积VC均热板配合三风扇达成280W功耗处理能力,后者则引入双液金与液体循环冷却模组,实现在高负载下更优的温度控制;两者皆支持175W满功耗RTX 5090显卡运行,性能接近台式机,其中宏碁在持续散热与噪音表现上略占优势,…

    2025年12月6日 硬件教程
    000
  • Sora历史版本怎么比较_Sora不同版本视频生成效果对比指南

    首先获取Sora各版本发布信息,再通过统一测试基准生成视频,接着评估视觉连贯性与细节表现,然后量化模型对提示的响应准确性,最后分析底层架构变更以揭示性能提升原因。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 如果您想要了解Sora不同历史…

    2025年12月6日 科技
    000
  • 深入解析Google V8引擎:JavaScript代码执行的幕后机制

    google v8引擎作为高性能javascript运行时,其代码执行机制远超简单的抽象语法树(ast)解释器。v8通过解析、生成字节码并利用即时(jit)编译器将热点代码优化为高效机器码,实现了javascript的快速启动与极致性能。本文将详细探讨v8的编译与执行流程,并与基于ast的解释器进行…

    2025年12月6日 web前端
    000
  • VSCode数据科学:Jupyter Notebook交互式编程环境

    VSCode通过内置Jupyter支持实现代码与文档一体化,无需额外配置即可编辑.ipynb文件,按单元格运行并实时显示输出结果;结合# %%标记可在Python脚本中创建交互式单元,便于从探索分析过渡到正式开发;集成Matplotlib、Pandas等可视化工具,图表和数据表内嵌显示,支持调试断点…

    2025年12月6日 开发工具
    000
  • 快手网页版直接打开

    快手网页版在线访问 直接访问网页版地址:www.kuaishou.com 如何登录快手网页版 1、复制上面的网址,在浏览器中打开,进入快手官方网站页面。 2、进入首页后,点击右上角的“登录”按钮。 3、支持多种登录方式,包括使用快手App扫码登录、手机号登录,以及通过微信或QQ快捷登录。 快手视频如…

    2025年12月6日 软件教程
    000
  • 红米K80 Pro 系统卡顿优化 红米K80 Pro 性能提升技巧

    红米K80 Pro卡顿多因后台占用或设置未优化,通过清理后台应用、清除缓存、卸载闲置App、降低系统动画缩放、关闭内存扩展与系统广告、限制后台进程及开启强制GPU渲染等设置调整,可显著提升流畅度。若问题依旧且电池老化,需检查硬件。 红米K80 Pro出现系统卡顿,多数情况是后台资源被过度占用或系统设…

    2025年12月6日 手机教程
    000
  • Linux SSH授权密钥与权限设置

    SSH密钥认证需正确配置权限与SELinux上下文。1. 生成Ed25519密钥并部署公钥至服务器authorized_keys文件;2. 设置~/.ssh目录权限为700,authorized_keys文件权限为600;3. 主目录不可有组或其他写权限;4. SELinux启用时需确保.ssh目录…

    2025年12月6日 运维
    000

发表回复

登录后才能评论
关注微信