大模型对语言有自己的理解！MIT 论文揭示大模型“思维过程”

程序猿 • 2025年11月10日 13:47:38 • 硬件教程 • 阅读 0

大模型对现实世界，可以形成自己的理解！

MIT 的一项研究发现，随着模型能力越强，它对现实的理解可能不仅是简单模仿。

比如大模型没有闻过气味，是否就意味着它不能理解气味？

研究发现，它可以自发模拟一些概念，方便理解。

这项研究意味着，大模型未来有希望更深入理解语言和世界，论文已被顶会 ICML 24 接收。

这篇论文的作者是 MIT 计算机与人工智能实验室（CSAIL）华裔博士生 Charles Jin 和他的导师 Martin Rinard 教授。

研究当中，作者让大模型只学习代码文本，结果发现模型逐渐掌握了其背后的含义。

Rinard 教授表示，这项研究直接针对现代人工智能的一个核心问题——

大模型的能力仅仅是由于大规模的统计相关性，还是对它们要处理的现实问题产生了有意义的理解？

△来源：MIT 官网

同时这项研究也引发了不少讨论。

有网友表示，虽然大模型对语言的理解可能和人类不同，但这项研究至少说明了模型做的绝不仅仅是对训练数据的记忆。

让大模型学习纯代码

为了探究大模型能否产生语义层面的理解，作者构建了一个由程序代码及其对应输入输出组成的合成数据集。

这些代码程序用一种名为Karel的教学语言编写，主要用于实现机器人在 2D 网格世界中导航的任务。

这个网格世界由 8×8 的格子组成，每个格子可以包含障碍物、标记物或空地。机器人可以在格子间移动，并进行放置 / 拾取标记物等操作。

Karel 语言包含 5 个原始操作—— move（前进一步）、turnLeft（左转 90 度）、turnRight（右转 90 度）、pickMarker（拾取标记物）、putMarker（放置标记物），程序就是由这些原始操作的序列组成。

作者随机生成了一个包含 50 万个 Karel 程序的训练集，每个程序长度在 6 到 10 之间。

每个训练样本由三部分组成：5 个输入状态、5 个输出状态和完整的程序代码，输入输出状态以特定格式编码进字符串中。

利用这些数据，作者训练了标准 Transformer 架构的 CodeGen 模型的一个变体。

训练过程中，模型可以访问每个样本中的输入输出信息和程序前缀，但看不到程序执行的完整轨迹和中间状态。

除了训练集，作者还构建了一个包含 1 万个样本的测试集，用于评估模型的泛化性能。

为了研究语言模型是否掌握了代码背后的语义，同时深入了解模型的 ” 思维过程 “，作者设计了一套包含线性分类器和单 / 双隐层 MLP 的探测器组合。

探测器的输入是语言模型在生成程序 tokens 过程中的隐藏状态，预测目标则是程序执行的中间状态，具体包括机器人的朝向（direction）、相对于初始位置的偏移量（position）以及是否正面朝向障碍物（obstacle）这三个特征。

在生成模型的训练过程中，作者每隔 4000 步记录一次上述三个特征，并同时记下生成模型的隐藏状态，形成探测器的训练数据集。

大模型学习的三个阶段

通过观察语言模型产生的程序的多样性、困惑度等指标随训练进程的变化，作者将训练过程分为了三个阶段——

Babbling（胡言乱语）阶段：输出程序重复度高，探测器准确率不稳定。

语法习得阶段：程序多样性迅速提高，生成准确率小幅提升，困惑度下降，说明语言模型习得了程序的句法结构。

语义习得阶段：程序多样性和句法结构掌握程度平稳，但生成准确率和探测器性能大幅提升，说明语言模型习得了程序的语义。

具体来说，Babbling 阶段占据了整个训练过程的前 50%，例如在训练到 20% 左右的时候，无论输入什么规范，模型都只会生成一个固定的程序—— “pickMarker” 重复 9 次。

语法习得阶段处于训练过程的 50% 到 75%，模型在 Karel 程序上的困惑度显著下降，表明语言模型开始更好地适应 Karel 程序的统计特性，但生成程序的准确率提升幅度不大（从 10% 左右提升到 25% 左右），仍然无法准确完成任务。

语义习得阶段是最后的 25%，程序的准确率出现了急剧提升，从 25% 左右提升到 90% 以上，生成的程序能够准确地完成给定的任务。

进一步实验又发现，探测器不仅可以对 t 时刻的同时间步进行预测，还能预测后续时间步的程序执行状态。

举例来说，假设生成模型在 t 时刻生成了 token”move”，并将在 t+1 时刻生成 “turnLeft”。

与此同时，t 时刻的程序状态是机器人面向北方，位于坐标 ( 0,0 ) ，而 t+1 时刻机器人将是机器人将面向西方，位置不变。

如果探测器能够从语言模型在 t 时刻的隐藏状态中，成功预测到 t+1 时刻机器人会面向西方，就说明在生成 “turnLeft” 之前，隐藏状态就已经包含了这一操作带来的状态变化信息。

这一现象说明，模型并非只对已生成的程序部分有语义理解，而是在生成每一步时，就已经对接下来要生成的内容有所预期和规划，显现出了初步的面向未来的推理能力。

但这一发现又给这项研究带来了新的问题——

实验中观察到的准确度提升，到底真的是生成模型进步了，还是探测器自己推论的结果呢？

为了解决这个疑惑，作者补充了语义探测干预实验。

实验的基本思路是改变程序操作的语义解释规则，具体又分为 “flip” 和 “adversarial” 两种方式。

“flip” 是强行反转指令含义，如将 “turnRight” 强行解释为 ” 左转 ” 不过能进行这种反转的也只有 “turnLeft” 和 “turnRight”；

“adversarial” 则是将所有指令对应的语义随机打乱，具体方式如下方表格。

如果生成模型的隐藏状态只编码了程序的句法结构，而非语义信息，那么探测器应该仍然能够从隐藏状态中以同等的性能去提取这些被改变的语义信息。

相反，如果探测器性能显著下降，则说明探测器显示出的的性能提升的确是因为生成模型隐藏状态编码了实际语义。

实验结果显示，在两种新语义下，探测器的性能都出现了显著下降。

尤其是在 “adversarial” 模式下更加明显，这也与该模式下的语义与原始语义差异更大的特征相一致。

这些结果有力地排除了探测器 ” 自己学会语义映射 ” 的可能性，进一步证实了生成模型的确掌握了代码的含义。

论文地址：

https://icml.cc/virtual/2024/poster/34849

参考链接：

[ 1 ] https://news.mit.edu/2024/llms-develop-own-understanding-of-reality-as-language-abilities-improve-0814

[ 2 ] https://www.reddit.com/r/LocalLLaMA/comments/1esxkin/llms_develop_their_own_understanding_of_reality/

以上就是大模型对语言有自己的理解！MIT 论文揭示大模型“思维过程”的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/9476.html

mit 探测器模型理解自己论文语言

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

王化回应“小米通话”停服：与手机能否打电话是两码事

上一篇 2025年11月10日 12:26:04

小米许斐海外调研：17 Pro 系列新机在德国大受欢迎

下一篇 2025年11月10日 14:06:53

好文分享

css 什么语言

CSS是一种用来表现HTML或XML等文件样式的计算机语言，是能够真正做到网页表现与内容分离的一种样式设计语言。CSS不仅可以静态地修饰网页，还可以配合各种脚本语言动态地对网页各元素进行格式化。本教程操作环境：windows7系统、CSS3版、Dell G3电脑。 CSS是什么语言？ CSS是一种…

程序猿
2025年12月24日
0000
好文分享

如何保持文本格式不变

要保持文本格式不变，需根据需求选择合适格式：若需保留视觉与布局，使用PDF或.docx；若为纯文本或代码，应选用UTF-8编码的纯文本文件，并用专业编辑器处理，避免隐藏格式与乱码。要保持文本格式不变，核心在于理解“不变”的语境是什么，以及你所处理的文本是“富文本”还是“纯文本”。通常，这意味着你需…

程序猿
2025年12月22日
0000
好文分享

揭秘HTTP状态码的语言奥秘

HTTP状态码是网页开发中经常遇到的概念。它们以三位数字的形式出现，用于指示特定HTTP请求的处理结果。这些状态码不仅包含了基本的信息，还蕴含着一种语言的奥秘。本文将深入揭秘HTTP状态码的语言奥秘。首先，我们要理解HTTP状态码是如何工作的。当客户端发送一个HTTP请求给服务器时，服务器会根据请…

程序猿
2025年12月22日
0000
好文分享

深入了解HTML全局属性的主要概念和特性

理解HTML全局属性的关键概念与特点，需要具体代码示例 HTML全局属性（Global Attributes）是指可以用于所有HTML元素的通用属性。全局属性的存在使得开发者可以更加灵活地控制元素的行为和样式。理解HTML全局属性的关键概念与特点，可以帮助开发者更好地使用这些属性来构建网页。下面将…

程序猿
2025年12月22日
0000
好文分享

揭示的语言之谜：HTTP状态码

HTTP是现代计算机网络中最常用的协议之一，而其中的状态码则是HTTP通信过程中非常重要的一部分。通过状态码，服务器可以向客户端传递各种信息，包括请求成功与否、请求重定向、请求错误等。尽管状态码只是简单的3位数字，但它们背后隐藏着许多语言之谜。首先，我们来探索一下HTTP状态码的基本分类。按照类别…

程序猿
2025年12月22日
0000
好文分享

揭秘HTTP状态码的含义

HTTP状态码是用于表示HTTP请求的结果的三位数字代码。这些状态码由HTTP协议规定，并且在与服务器进行通信时，它们扮演着非常重要的角色。尽管每个状态码都有其特定的含义，但是很少有人知道这些代码背后隐藏的深意和故事。本文将探秘HTTP状态码背后的语言之谜。首先，我们来了解一下最常见的HTTP状态…

程序猿
2025年12月22日
0000
好文分享

解读HTTP状态码404并制定相应的解决方案

理解HTTP状态码404的意思及应对策略 HTTP是一种用于传输超文本的协议，它使用状态码来表示服务器对请求的响应状态。其中，状态码404是最为常见的一种，它代表了“未找到”（Not Found）的意思。当我们在浏览器中访问一个网页或者请求一个资源时，如果服务器无法找到所请求的资源，就会返回404状…

程序猿
2025年12月22日
0000
好文分享

理解浏览器中cookie的存放位置

在现代互联网时代，cookie作为一种重要的网页信息存储方式，经常被互联网应用所使用。那么，什么是cookie？它是如何工作的？cookie在浏览器中的存放位置又是如何呢？让我们一起来深入了解吧。首先，cookie是一种存储在用户浏览器中的文本文件，里面包含了一些网站的信息，比如用户输入的用户名、…

程序猿
2025年12月21日
0000
好文分享

掌握Canvas的跨语言兼容性

随着互联网的快速发展，Web技术也在不断更新与演进。其中，HTML5标准的制定对于Web开发者来说，无疑是一个重大的进步。而HTML5的一个重要特性就是Canvas元素，它提供了一种使用JavaScript脚本进行绘制图形的方法。作为一个具有强大绘图功能的元素，Canvas在Web开发中越来越受到开…

程序猿
2025年12月21日
0000
好文分享

发掘sessionstorage的潜力：它对我们有何用处？

理解SessionStorage：它能为我们做什么？随着前端技术的快速发展，现代Web应用程序需要在用户的浏览器端存储和管理大量的数据。为了满足这个需求，HTML5引入了一种被称为SessionStorage的Web存储方案。本文将探讨SessionStorage的基本概念和它可以为我们做的事情，…

程序猿
2025年12月21日
0000
好文分享

解析HTTP状态码的意义和作用

HTTP（Hypertext Transfer Protocol）是一种用于在网络中传输超文本的应用层协议。在HTTP协议中，服务器和客户端之间通过交换消息来完成数据通信。在客户端向服务器发送请求并得到响应时，服务器会通过HTTP状态码来表示请求的处理结果。HTTP状态码是用数字形式表示的三位数，每…

程序猿
2025年12月21日
0000
好文分享

html是一种页面什么型语言？

html是一种页面“描述”型语言。HTML文本是由HTML命令组成的描述性文本，HTML命令可以说明文字，图形、动画、声音、表格、链接等。（推荐教程：html教程） html是一种页面“描述”型语言。 HTML（Hyper Text Mark-up Language）即超文本标记语言或超文本链接标…

程序猿
2025年12月21日
0000
html的盒模型详解

这次给大家带来html的盒模型详解，使用html盒模型的注意事项有哪些，下面就是实战案例，一起来看一下。 1.1. 盒的内容区的尺寸— content width和content height —取决于几个因素： –生成该盒的元素是否设置了’width’或&#82…

程序猿
好文分享 2025年12月21日
0000
HTML的语言编码有哪些

在html里，编码可导致浏览者通过ie时候网页乱码，也可以导致div+css的兼容性hack，编码非常的重要，一般编码的位置放在html网页中的head>和中间。今天我们就介绍一下关于编码的知识。一般这段网页编码放在html网页中的和中间。 html编码样式通过改变charset=utf…

程序猿
好文分享 2025年12月21日
0000
html规定元素内容的语言属性lang

实例段落中的一些法文： Ceci est un paragraphe. 浏览器支持所有浏览器均支持 lang 属性。定义和用法 lang 属性规定元素内容的语言。提示和注释注释：lang 属性在以下标签中无效：, , , set>, , 以上就是html规定元素内容的语言属性lang…

程序猿
好文分享 2025年12月21日
0000
html最新的flex布局的理解

每当我们去进行前端页面布局时都会用到float、position、margin等一些属性，这些属性用起来略显麻烦，并且浏览器去进行渲染时会大大消耗性能所以今天我们来谈谈最新的 flex布局，也叫弹性布局！需要注意的是任何容器都可以指定为flex布局，但是在flex布局中float、clear、v…

程序猿
好文分享 2025年12月21日
0000
html中对页面布局的理解

做页面前，先分析页面的布局，有几个模块，就用几个p，可以层层嵌套。、用了p后，进行浮动就不会出现样式错乱代码大概是这样的（有点繁琐，不过解决了燃眉之急）： LANUX蓝脑商务网站系统 LANUX V1.0 蓝脑商务网站系统适用于网店、公司宣传自己的品牌和产品。系统在代码、页面方面设计简约，浏…

程序猿
2025年12月21日 • 好文分享
0000
好文分享

js数组如何理解

数组是JavaScript中用于存储多个值的有序容器，索引从0开始，支持动态增删元素和混合数据类型。它本质是特殊对象，索引对应字符串属性名，typeof返回”object”，需用Array.isArray()准确判断。常用方法包括push、pop、shift、unshift、…

程序猿
2025年12月21日
0000
好文分享

C++框架的MIT许可类型解读

mit 许可证允许 c++++ 框架的自由使用、修改和分发。允许使用、修改和分发：任何人可以出于任何目的使用、修改和分发 mit 许可的 c++ 框架。著作权声明：分发的代码必须包含原始著作权声明和 mit 许可证条款。免责声明：框架的作者或贡献者不对因使用框架而造成的任何损害或损失承担责任。 C+…

程序猿
2025年12月18日
1000
好文分享

c语言是一种什么编译形式的语言

什么是编译模式？编译模式是指如何在内存中放置程序代码及数据，如何分配堆栈，并确认占用的内存大小及如何存取它们，当指定内存模式（编译模式）以后，语言编译程序将按事先选择好的内存模式编译组织程序。 C语言中提供了6种编译模式，这6种模式是：微模式（Tiny），小模式（Small），中模式（Medium…

程序猿
2025年12月17日
0000

发表回复

登录后才能评论

大模型对语言有自己的理解！MIT 论文揭示大模型“思维过程”

关于作者

相关推荐

发表回复