CREATOR制造、使用工具,实现LLM「自我进化」

自古以来,工具的使用被视为区分人与其他物种的一大区别,也被视为是智能的一种根本体现。而当下,人工智能已不再局限于对工具的简单使用,它们已然能够根据问题创造性地建立自己的工具来寻求解决方案。在思维上,这代表着当下大模型已经能够掌握更高层次的抽象思维认知,并将其与具象思维划分,共同解决问题;而在能力上,工具创造的出现也意味着模型已经能够从 “学习” 中蜕变,去运用已知 “创造” 未来的无限可能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

CREATOR制造、使用工具,实现LLM「自我进化」

论文链接:https://arxiv.org/pdf/2305.14318.pdf

研究背景

近年来,大规模语言模型(Large Language Models)取得了显著的研究进展,包括 GPT-3、Codex、PaLM、LLaMA、ChatGPT 和最近发布的 GPT-4 等。这些模型在上下文学习(In-Context Learning)、代码生成(Code Generation)和各种其他自然语言处理任务方面表现出色,将模型的潜力进一步推向了通用人工智能。

尽管大模型在这些取得了巨大的成功,其当下仍然存在很多短板,包括无法识别或回答最新的实时信息、很难在大规模的数据计算上达到高准确性,在题干逻辑复杂时推理能力不稳定等等。针对这些短板,研究者开始致力于向当前模型架构中引入对外部资源的利用能力,例如引入计算器,问答系统,维基百科等等外部知识源,来增强模型能力。这一系列研究奠定了模型工具学习(Tool Learning)能力的基础。

然而,当下研究中利用的外部工具数量仍然有限,而在潜在的新任务类型几乎是无尽的。因此,在面对新的问题类型时,很难找到现有的适合解决问题的工具。此外,即使提供了有效的可利用的工具,模型需要在工具包文档中进行海量搜索、匹配并针对问题进行针对性地规划。这将给模型带来很大的认知负担,并需要较高的学习成本

因此,研究团队提出了全新的一种研究范式:工具创造(Tool Creation)。其不再是简单利用大模型使用工具的能力,而是加入了全新的工具创造模块,让模型针对所面对的问题进行工具创造并寻求解决方案。

利用大模型创造工具能够提高工具的普适性、可复用性和多样性,超越给定 API 的限制。工具创造模块的设计还可以减轻大模型的认知负担,并解耦其进行抽象推理(创建可推广的具有普适性的工具)和具象推理(根据工具实现细节和工具使用文档进行决策)的能力。同时,该框架下模型以代码作为工具创造的媒介,这使得模型对于错误更加敏感,并能根据工具创造与使用中的问题进行回溯与修正

CREATOR制造、使用工具,实现LLM「自我进化」

工具创造范式相比工具使用更加灵活并对不同场景有更强的适应能力

CREATOR 研究框架

大模型进行工具创造来解决问题的框架 CREATOR 主要分为了以下四个阶段:

创造(Creation):运用大模型对于问题的抽象推理能力,通过代码有针对性性地创造所需工具以及其使用说明。决策(Decision):运用大模型对于问题的具象推理能力,决策如何调用工具来解决当前问题。执行(Execution):根据创造的工具以及决策内容,进行决策的执行,并捕获执行过程中的输出信息。修正(Rectification):运用大模型对于错因推理以及自我修复的能力,对执行阶段捕捉到的问题进行修复。

CREATOR制造、使用工具,实现LLM「自我进化」

大模型进行工具创造与决策的流程框架

大模型首先将根据问题创造所需要的工具以及其相关使用说明;此后,问题内容以及工具信息将同时再次返回给大模型,用以决策针对本问题的解决方案,以及如何使用这些工具。此后,模型将根据执行情况对工具及决策做出调整,以更好地适应问题并寻求解答。

整个工具创造框架灵活运用了大模型的不同思维能力:提取问题关键信息的抽象思维推理,根据任务实施方案决策的具象思维推理,以及根据问题寻求解决方案的自我修复推理。这些能力的解耦帮助大模型避免了在普通推理链(Chain-of-Thought, CoT)中的思维混乱而导致的失败现象,有效提升了大模型对于任务的适应能力及表现。

CREATOR 实验评测

作者将 CREATOR 框架与当前的普通推理链方法(CoT),程序推理链方法(Program-of-Thought, PoT)以及没有创造的简单工具使用(Tool Use)进行了比对。同时,为了验证框架中剥离抽象推理与具象推理的有效性,作者还额外引入了整体工具创造(Tool Create – whole)作为基线,该方法将 CREATOR 框架中的创造阶段与决策阶段合二为一,不再进行推理能力上的解耦。

CREATOR制造、使用工具,实现LLM「自我进化」

Creation Challenge 数据集问题,标准工具及决策示例

CREATOR制造、使用工具,实现LLM「自我进化」

在 MATH 数据集上 CREATOR 框架的表现高于其他推理方法以及简单的工具运用

在数据集的选取上,作者选择了 MATH 以及 TabMWP 数据集作为主要验证。其中前者包含了美国数学竞赛当中的高难度数学问题,而后者将问题与丰富的数据表结合,二者都考验了模型对于多样化场景的问题推理与解决能力。除此之外,作者还额外引入了全新构建的 Creation Challenge 数据集,其中的问题都无法直接套用现有工具或者代码包解决,从而考验了模型进行工具创造的能力。

CREATOR制造、使用工具,实现LLM「自我进化」

CREATOR制造、使用工具,实现LLM「自我进化」

在 TabMWP 数据集以及 Creation Challenge 上 CREATOR 框架效果也显著更强

从实验结果看来,CREATOR 框架的推理结果要明显好于所有基线,尤其相对于标准的推理方法以及程序推理方法,均达到了更好的效果。同时实验也证明了对抽象与具象推理能力进行解耦也可以有效帮助模型提高准确率。在 Creation Challenge 测试集上,作者还额外验证了在有创造什么样的工具的提示(hint)的情况下,模型将会对问题有着更强的解决能力。因此,提示与思维解耦这两点也成为了工具创造中的重要影响因素。

CREATOR制造、使用工具,实现LLM「自我进化」

不同方法针对任务难度的准确率统计

CREATOR制造、使用工具,实现LLM「自我进化」

在修正阶段的参与下效果的提升

黑点工具 黑点工具

在线工具导航网站,免费使用无需注册,快速使用无门槛。

黑点工具 18 查看详情 黑点工具

除此之外,作者还验证了不同方法对于任务难度的变化曲线,以及修正阶段参与轮次与大模型效果提升之间的联系。结果表明,CREATOR 框架面对有难度的问题能够保持更好的鲁棒性,以及修正阶段的参与能够让不仅是 CREATOR 框架,甚至是 PoT 推理方法都能得到大幅度提升,证实了在实验中引入修正阶段的合理性与有效性。

工具创造的其他优势

在主实验之外,文章作者也着重探讨了工具创造的其他优势以及当下大模型工具创造能力的不同展现形式。既然是创造工具,那么作为工具的一大优势必定是其可复用性。作者也顺此思路进一步展示了工具的复用对于任务效果的提升。

作者设计了 300 条问题并三个一组分为了 100 组。其中每一组的三个问题虽然场景不同,但都涉及相同的核心知识(Core Knowledge),即同类问题。作者验证了将对于一个问题创造的工具用于一组问题中的所有场景,是否都能够有效解决并提升准确率。

CREATOR制造、使用工具,实现LLM「自我进化」

对于大模型创造的工具在其他问题上迁移,能够有效提高准确率

实验统计表明将模型创造的正确可用的工具迁移到其他同类问题场景,能够有效提升问题解决的正确率。这即表明大模型创造的工具具有良好的可复用性,对于同类问题也有着良好的普适性。

除此之外,作者还展示了大模型进行工具创造的三个维度:对已有工具进行封装以实现不同目的,将不同工具进行组合实现目标功能,以及进行层次化的工具创建。这三个维度由低到高展示了当下大模型工具创造的能力,而这些能力也帮助大模型能够更高效地适应不同场景。

CREATOR制造、使用工具,实现LLM「自我进化」

大模型进行工具创造的三个维度

总结

CREATOR 框架通过工具创造实现了大模型抽象与具象思维能力的解耦,是继工具学习之后,对模型能力边际探索的又一大突破。相信未来的更多研究将会以此为基础,继续在工具的使用与创造上不断证明与增强模型潜力,为我们带来更多惊喜。

文章主要作者

CREATOR制造、使用工具,实现LLM「自我进化」

钱成,清华大学大三年级本科生,THUNLP 实验室成员,导师刘知远。目前研究方向包括大模型预训练,大模型高效微调,以及工具学习等领域。曾获清华大学计算机综合优秀奖学金,并以共同一作身份在 EMNLP,ACL 等国际会议中发表论文。

个人主页:https://qiancheng0.github.io/

以上就是CREATOR制造、使用工具,实现LLM「自我进化」的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/523165.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 06:37:37
下一篇 2025年11月9日 06:43:21

相关推荐

  • 探究最佳响应式布局框架:竞争激烈!

    响应式布局框架大比拼:谁是最佳选择? 随着移动设备的普及和多样化,网页的响应式布局变得越来越重要。为了满足用户的不同设备和屏幕尺寸,在设计和开发网页时采用响应式布局框架是必不可少的。然而,面对众多的框架选择,我们不禁要问:哪个是最佳选择? 以下将对目前比较流行的三种响应式布局框架进行比较评价,它们分…

    2025年12月24日
    000
  • 深入学习响应式布局框架:适合初学者到专家的详尽指南

    响应式布局框架解析:从初学者到专家的必备指南 随着移动设备的普及和多样化,响应式布局成为了现代Web设计的必备技能。响应式布局框架以其简单、灵活和可维护的特点,成为了开发者们的首选工具。然而,对于初学者来说,学习和理解响应式布局框架可能会感到有些困惑。本文将从初学者到专家,为您提供一个详细的指南,帮…

    2025年12月24日
    000
  • 选择最适合您的响应式布局框架:综合评估不同工具

    响应式设计是指网页可以根据不同设备的屏幕尺寸和分辨率进行自适应的布局,以确保在各种设备上都能提供良好的浏览体验。为了方便开发者实现响应式布局,出现了许多优秀的框架和工具。本文将汇总一些主流的响应式布局框架,并提供具体的代码示例,帮助读者选择最适合自己的工具。 Bootstrap(https://ge…

    2025年12月24日 好文分享
    000
  • 探索五种流行的响应式设计框架

    随着移动设备的广泛应用和互联网的普及,响应式布局已经成为了网页设计的重要概念。响应式布局能够根据用户使用的设备(如手机、平板、电脑等)不同的屏幕尺寸和分辨率,自动适应调整网页的布局和样式,提供更好的用户体验。 为了快速实现响应式布局,开发者可以使用现成的响应式布局框架。这些框架提供了一系列的CSS和…

    2025年12月24日
    000
  • 揭示粘性定位的关键要素是什么?揭示达到粘性定位的关键要点

    研究粘性定位的关键因素是什么?探索粘性定位的要点 粘性定位(stickiness positioning)是指在市场营销中,企业通过创造和维护与消费者之间的积极、持久的关系,使其成为消费者心中的首选品牌。在如今竞争激烈且消费者选择众多的市场环境下,粘性定位成为企业获取长期竞争优势的关键要素之一。那么…

    2025年12月24日
    000
  • 了解Ajax框架:探索常见的五种框架

    了解Ajax框架:探索常见的五种框架,需要具体代码示例 引言:在现代Web应用开发中,Ajax是必不可少的技术之一。它以其支持异步数据交互,提升用户体验等特点,成为了前端开发中不可或缺的一部分。为了更好地了解和掌握Ajax框架,本文将介绍五种常见的Ajax框架,并提供具体的代码示例,帮助读者深入了解…

    2025年12月24日
    000
  • 解析网页设计中CSS框架和排版的作用与优点

    在如今的网页设计领域,排版和CSS框架扮演着至关重要的角色。而在这种快节奏的工作中,更快速、更高效地完成任务显得尤为关键,这就是排版和CSS框架的优势所在。本文将会探讨如何使用这些工具来优化网页设计,同时提供一些实际的代码篇例,以便读者更好地理解。 一、CSS框架的作用和优势 CSS框架是为了能够更…

    2025年12月24日
    000
  • 揭开提高手机网页开发效率的秘密武器:了解手机CSS框架的全貌

    在如今移动互联网盛行的时代,手机网页开发已经成为一项必要的技能。相比于传统PC端网页,手机网页的开发要面临更多的挑战和限制。因此,使用一些高效的开发工具和技巧可以大大提高开发效率和质量。其中之一就是手机CSS框架。本文将介绍手机CSS框架的基本概念、常用的手机CSS框架以及具体代码示例,希望能对大家…

    2025年12月24日
    000
  • 常见的css框架有哪些

    常见css框架:1、Bootstrap框架;2、Foundation框架,一个专业的前端框架;3、Pure框架,优点是渲染快;4、Skeleton框架;5、99lime HTML KickStart框架,适合网站快速开发;6、Kube框架。 本教程操作环境:windows7系统、CSS3版、Dell…

    2025年12月24日 好文分享
    000
  • 15 个优秀的响应式 Web 设计 HTML 和 CSS 框架

    【推荐教程:CSS视频教程 】 响应式 Web 设计旨在为各种设备(从台式机显示器到手机)提供最佳的浏览体验。本文汇总了一些优秀的响应式 Web 设计 HTML 和 CSS 框架。这些框架都是开源的并免费的。 对响应式 Web 框架进行比较并不那么容易。有的框架适合设计更快、更精简网站的某些功能,而…

    2025年12月24日 好文分享
    000
  • 最受欢迎的10大CSS框架

    web 开发工程师在开发页面样式的时候需要花费大量的时间开发,其中最头疼的还是浏览器的兼容性问题,最省事的是使用 css 框架,幸运的是一些大神编写了一套精美的 css 框架并开源出来,那么有哪些不错的 css 框架呢? 我收集了一些资料和数据来和大家讨论,下面我就说说 Github 上 star …

    好文分享 2025年12月24日
    000
  • ai做html怎么运行_AI生成html运行步骤【教程】

    答案是使用AI生成HTML代码后,将其保存为.html文件并用浏览器打开即可运行。具体步骤为:1. 在AI工具中输入需求生成HTML代码;2. 将代码复制到文本编辑器并另存为index.html,编码选UTF-8,类型选“所有文件”;3. 双击该文件用浏览器打开,若无法正常显示需检查文件后缀、编码及…

    2025年12月23日
    000
  • HTML文件的框架是什么?如何编辑HTML文档?

    一个最基本的html文件框架包含以下核心部分:1.声明html5文档类型,避免浏览器怪异模式;2.作为根元素并指定语言;3. 包含元数据如设置字符编码、适配移动设备、定义网页标题;4.承载实际内容,如 标题和 段落;编辑html需用文本编辑器(如vs code)创建或打开.html文件,编写代码后保…

    2025年12月22日 好文分享
    000
  • 学习canvas框架 详解常用的canvas框架

    探索Canvas框架:了解常用的Canvas框架有哪些,需要具体代码示例 引言:Canvas是HTML5中提供的一个绘图API,通过它我们可以实现丰富的图形和动画效果。为了提高绘图的效率和便捷性,许多开发者开发了不同的Canvas框架。本文将介绍一些常用的Canvas框架,并提供具体代码示例,以帮助…

    2025年12月21日
    000
  • 学习不同canvas框架:了解各种canvas框架的特性与使用场景

    深入研究canvas框架:掌握多种canvas框架的特点与应用场景,需要具体代码示例 近年来,Web前端开发的重要领域之一是图像处理和动画效果。为了实现这些效果,开发人员通常使用HTML5的canvas元素。canvas元素提供了一个可以通过JavaScript来绘制图形的空白容器。 为了更好地利用…

    2025年12月21日
    000
  • 简介:HTML中的CSS框架是什么?

    什么是HTML中的CSS框架?一种简介 HTML和CSS是构建网页的两个基本技术。HTML用于创建网页结构,而CSS则用于设计网页的外观和样式。在开发网页时,我们经常需要为每个元素编写样式,这可能非常繁琐而耗时。幸运的是,CSS框架的出现解决了这个问题,它们提供了一套预定义的样式和布局,简化了网页开…

    2025年12月21日
    000
  • 掌握CSS框架,提升网页设计效果的利器

    HTML是构建网页结构的标记语言,而CSS则是用于美化和布局网页的样式表语言。在网页设计中,使用CSS框架可以提升设计效果,使网页呈现出更专业、更吸引人的外观。本文将介绍一些常见的CSS框架,并分析它们的特点和优势。 Bootstrap(响应式设计) Bootstrap是目前最受欢迎的CSS框架之一…

    2025年12月21日
    000
  • 深入研究CSS框架,提升网页布局和样式的能力

    CSS(Cascading Style Sheets)是一种用于描述网页样式和布局的语言,它使得网页设计更加灵活和易于管理。然而,编写和管理大型网页样式表可能会变得复杂和耗时。为了解决这个问题,开发人员们创建了各种CSS框架,这些框架提供了一套预定义的样式和布局模板,使得网页开发更加快速和高效。 本…

    2025年12月21日
    000
  • HTML框架怎么用

    一个浏览器文档窗口只能显示一个网页文件,但是可以通过使用框架,在同一个浏览器窗口中显示不止一个页面,本文就来介绍一下html框架 一、框架 一个浏览器文档窗口只能显示一个网页文件,但是可以通过使用框架,在同一个浏览器窗口中显示不止一个页面。使用框架的页面主要包含两个部分,一个是框架集,另一个就是具体…

    好文分享 2025年12月21日
    000
  • HTML 框架如何使用

    使用html框架的好处不用自己去写令人头疼的响应式了,html标签使用也比新手程序员使用的要严谨等,会使用了html框架这样对我们的html代码书写量也会减少哦! Previous Page Next Page 通过使用框架,你可以在同一个浏览器窗口中显示不止一个页面。 框架 立即学习“前端免费学习…

    好文分享 2025年12月21日
    000

发表回复

登录后才能评论
关注微信