谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

模型做奥赛题游刃有余,简单的数数却屡屡翻车的原因找到了。

谷歌的一项新研究,发现大模型不会数数的原因,并不是简单的 tokenizer 所致,而是没有足够的空间来存储用于计数的向量。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

数出一段话中某个单词出现的次数,这样简单的任务可以难倒许多大模型,GPT-4o、Claude 3.5 也无法幸免。

如果再进一步,想要找到出现频率最高的一个词,更是难如登天,即便能蒙对给出的具体数量也是错的。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

有人认为是词汇的 token 化导致了大模型看到的 ” 词 ” 和我们的看法不一致,但论文表明,实际情况并不是这么简单。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

想数清单词,嵌入维度要够大

Transformer 的计数能力与其嵌入维度 d 和词汇量 m(指词汇表中词的数量,非序列长度)的关系密切相关。

详细的原因,就涉及到了 Transformer 统计词频时的机制。

Transformer 通过一种特殊的嵌入方式,利用嵌入空间的线性结构,巧妙地将计数问题转化为了向量加法。

具体说是将每个词映射到一个独特的正交向量上,在这种表示下,词频可以通过对这些正交向量求和来简单地计算。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

然而,这种机制的局限性在于,它要求词汇表中的每个词都有一个独立的正交向量表示,因此嵌入维度必须大于词汇量。

嵌入维度不足时,词向量就无法保持正交性,词频的线性叠加也就无法实现了。

此时 Transformer 要实现计数,可以通过注意力机制(CountAttend)来实现,但需要一个随序列长度 n 线性增长的大型 ” 逆转 MLP” 层。

具体来说,模型首先通过注意力赋予被查询词较大的权重,再利用位置编码将注意力权重提取到值向量的最后一个元素,这个元素实际记录了被查询词的出现频率的倒数。

这意味着,模型需要一个大小为 O ( n ) 的 MLP 层来计算 1/x 函数(x 为某个词出现的次数)。

但进一步分析表明,任何常数层 ReLU 网络都无法在 o ( n ) 的神经元数量下逼近 1/x 函数。

因此,对于固定规模的 Transformer,这种方案无法推广到任意长度的序列。当序列长度超出训练集长度时,模型的计数能力会急剧恶化。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

长度非主要因素,词汇表中数量是关键

为了验证这一结论,作者一共进行了两个实验。

第一个实验,是在一个从头开始训练的 Transformer 模型上进行的,具体有关参数如下:

使用一个由两个 Transformer 层、四个注意力头组成的标准模型;

嵌入维度 d 的取值范围为 8 到 128;

对每个固定的 d,词汇量 m 从 5 到 150 变化,分别测试 20 个不同的值;

模型使用 Adam 优化器从零开始训练,批量大小为 16,学习率为 10^-4,训练 10 万步。

训练和评测数据通过随机采样生成。首先从大小为 m 的词汇表中均匀采样 n 个词,构成一个长度为 n 的序列。

序列长度 n 设置为 n=10m,平均每个词出现的次数固定为 10 次,一共使用了 1600 个样本进行测试。

作者发现,随着词汇量的增加,模型的计数准确率呈阶梯状下降,临界点恰好出现在词汇量超过嵌入维度的时刻。

为了进一步量化模型的计数能力,作者定义了一个指标 m_thr,表示模型的计数准确率下降到 80% 时的临界词汇量。

直观地说,m_thr 反映了在给定嵌入维度下,模型可以 ” 承受 ” 的最大词汇量,m_thr 越大说明模型的计数能力越强。

结果显示,对于计数(QC)和找出最高频词(MFC)的任务,m_thr 都随嵌入维度 d 的增大而近似线性增长。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

第二个实验则是在预训练的 Gemini 1.5 模型上开展,在这个实验中,作者更关注词汇量对计数能力的影响。

他们设计了一系列计数任务,每个任务使用不同大小的词汇表,并把每个词在序列中出现的平均次数固定。

这意味着,在实验组当中,词汇量越大,序列长度也就越长。

作为对照,作者还设置了一个 “Binary Baseline”,词汇表中只有固定为两个词,但序列长度与主实验组相同。

这样一来,就可以判断出带来模型计数误差的究竟是词汇量还是序列长度。

实验结果显示,随着词汇量的增加,Gemini 1.5 在计数任务上的平均绝对误差显著上升,而 “Binary Baseline” 的误差要低得多。

 谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题

这表明,词汇量的增加,而非序列长度的增长,是导致大模型计数能力下降的主要原因。

不过作者也表示,虽然这项研究一定程度上划定了大模型计数能力的上下界,但这些界限还不够紧致,距离理想的结果还有一定差距。

同时,作者也没有探究增加 Transformer 的层数是否会改变这一结论,需要未来开发新的技术工具才能进一步验证。

论文地址:

https://arxiv.org/abs/2407.15160

以上就是谷歌揭秘大模型不会数 r 原因:嵌入维度是关键,不止分词器问题的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/157835.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Java中Optional类的作用 解析Java Optional优雅处理null值的方法
上一篇 2025年12月5日 01:50:13
下一篇 2025年12月5日 01:52:15

相关推荐

  • 谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧谷歌浏览器如何截图 谷歌浏览器页面截图技巧

    使用谷歌浏览器的开发者工具截图步骤:1. 按ctrl+shift+i(windows/linux)或cmd+option+i(mac)打开开发者工具。2. 点击右上角三个点,选择”更多工具”,再选择”截图”。3. 选择截取整个页面。推荐的谷歌浏览器扩展…

    2026年5月10日 用户投稿
    100
  • Binance官方网站 币安Binance最新App下载 v3.8.0官方下载通道

    币安(binance)作为全球交易量领先的数字资产服务平台,其官方应用的安全性和功能的及时更新至关重要。本篇指南将为您详细解析如何通过币安官方网站,安全地获取并安装其最新版本的官方app,确保您使用的是官方正版通道,从而保障您的资产安全。 官网访问与账户准备 币安(Binance)官网入口: 币安(…

    2026年5月10日
    200
  • 火币app下载 火币app官方下载最新版 火币htx交易所安卓版

    若您需要下载火币htx官方最新版的安卓应用,最安全可靠的方式是通过其官方网站进行获取。为了保障您的数字资产安全,请务必避免使用任何非官方渠道提供的下载链接或安装包,因为这些来源可能包含恶意软件,对您的账户和资金构成威胁。访问官网后,通常可以在页面显眼位置找到app下载入口或二维码。 火币官网直达: …

    2026年5月10日
    000
  • binance交易平台官网入口 币安官方最新版v3.3.0APP下载安装

    binance交易平台官网入口 币安官方最新版v3.3.0APP下载安装binance交易平台官网入口 币安官方最新版v3.3.0APP下载安装binance交易平台官网入口 币安官方最新版v3.3.0APP下载安装binance交易平台官网入口 币安官方最新版v3.3.0APP下载安装

    欢迎来到币安(binance)的世界!作为全球领先的数字资产交易平台,保障账户安全的第一步就是从官方渠道获取应用程序。本指南将引导您如何安全下载并安装最新版的币安app,并完成后续的注册与安全设置。 币安官网直达: 币安官方app: 一、币安官方App下载与安装 为了确保您的资金安全,请务必通过官方…

    2026年5月10日 用户投稿
    000
  • 欧易OKX交易平台官网注册入口 2026欧易官方手机App下载地址

    作为全球顶级的数字资产服务平台,欧易(okx)为用户提供了安全、稳定的交易环境。寻找一个长期有效且官方认证的注册入口至关重要。本指南旨在为您提供一个面向未来的欧易okx官方渠道指引,确保您在当下乃至未来几年,都能通过最安全的方式访问官网并下载官方正版手机应用。 欧易OKX官网注册:开启您的数字资产之…

    2026年5月10日
    000
  • 火币app手机版入口 火币交易所官方手机版入口

    火币app是一款广受欢迎的数字资产交易平台,为用户提供安全、便捷的加密货币交易服务。它支持多种主流数字货币的交易,并提供实时行情、专业k线图、法币交易、合约交易等多种功能,满足不同用户的交易需求。本文将为您提供官方app的下载链接及详细的安装教程,点击本文提供的下载链接即可安全下载。 火币App下载…

    2026年5月10日
    000
  • o易交易所APP官方下载2025 okex安卓正版安装包v6.137.1

    o易交易所APP是一款功能全面的数字资产交易平台,致力于为全球用户提供安全、便捷、专业的加密货币交易服务。该应用支持多种主流数字货币的交易,包括比特币(BTC)、以太坊(ETH)等,并提供币币交易、合约交易、理财等多元化服务。 欧易官网入口: 欧易okex安卓正版安装包v6.137.1: o易交易所…

    2026年5月10日
    000
  • HTML的网页错位原因以及解决方法

    我们常常会遇到需要设置同一行的布局,但是却因为种种原因错了位,我总结了一下网页布局错位大概有俩种原因,今天给大家好好分析一下原因以及解决方法。 常常我们会遇到我们要设置在一行显示的布局,却因为种种原因造成了错位,看到结果是在一行的最后一个盒子布局错位掉下去了 造成DIV CSS网页布局错位的原因大概…

    用户投稿 2026年5月10日
    000
  • CEX充提币:中心化交易所使用技巧

    在加密货币交易的浩瀚宇宙中,选择一家可靠、高效且安全便捷的中心化交易所(cex)是每位投资者迈向成功的关键一步。尤其对于初入加密世界的新手而言,cex不仅是进入市场的大门,更是其资产的守护者。而对于经验丰富的交易者来说,深入掌握cex的充提币技巧,则意味着能够更灵活地调配资金,抓住稍纵即逝的市场机遇…

    用户投稿 2026年5月10日
    100
  • 欧易交易所 OKX全球主流交易平台(官方网站)

    欧易(OKX)是一款全球领先的数字资产服务平台,为用户提供币币、杠杆、期权/交割/永续合约、DEX交易、余币宝、DeFi挖 矿、借贷等多元化的产品矩阵,覆盖超过200个国家和地区,拥有千万级用户量,致力于为全球用户提供一站式的数字资产服务。 欧易交易所官方网站入口 欧易全球官方网址是: 欧易OKX下…

    2026年5月10日
    000
  • HTML地理位置怎么优化_本地SEO代码优化技巧

    HTML地理位置优化需使用Schema.org标记并确保信息一致,结合关键词、地图嵌入和本地内容提升本地搜索排名。 HTML地理位置优化,简单来说,就是让你的网站在本地搜索结果中更容易被找到。核心在于告诉搜索引擎你的网站与特定地理位置相关,并提升用户体验。 解决方案 使用Schema.org标记: …

    2026年5月10日
    200
  • 欧易官方iOS版下载_苹果手机欧易APP官方入口

    欧易官方iOS版下载_苹果手机欧易APP官方入口欧易官方iOS版下载_苹果手机欧易APP官方入口欧易官方iOS版下载_苹果手机欧易APP官方入口欧易官方iOS版下载_苹果手机欧易APP官方入口

    想要进入数字资产的世界,选择一个安全可靠的平台至关重要。本文将作为您的向导,详细拆解欧易(okx)交易所从入门到上手的全部流程,包括官方渠道访问、app安全下载安装,以及新用户注册的每一步。跟随本指南,轻松开启您的交易之旅。 第一步:访问欧易OKX官方网站 欧易官方网址: 欧易官方app: 1、请通…

    2026年5月10日 用户投稿
    000
  • 币安Binance正版官网地址 币安Binance安全登录官网

    如果你想访问币安Binance正版官网并进行安全登录,那么掌握正确的网址和安全操作方法非常关键。本文将为你详细介绍如何访问官方平台,以及在登录过程中需要注意的安全细节,帮助你更安心地管理加密货币资产。 官网入口: APP下载: 官网访问方法 1、确认网址:在访问币安Binance官网时,一定要输入官…

    2026年5月10日
    100
  • 2025欧意交易所app官方下载 欧意 v6.138.1 最新版app安卓版

    欧意交易所App是一款广受欢迎的数字资产交易平台,致力于为全球用户提供安全、便捷、专业的加密货币交易服务。平台支持多种主流数字货币的交易,界面友好,功能强大,是您管理和增值数字资产的理想选择。 欧易官网入口: 欧易官网直链下载: 下载步骤 1、点击上方提供的官方下载链接,浏览器将自动开始下载欧意交易…

    2026年5月10日
    000
  • 币安binanceapp官方下载安装 币安2025安卓最新版本入口地址

    币安binanceapp官方下载安装 币安2025安卓最新版本入口地址币安binanceapp官方下载安装 币安2025安卓最新版本入口地址币安binanceapp官方下载安装 币安2025安卓最新版本入口地址币安binanceapp官方下载安装 币安2025安卓最新版本入口地址

    币安(Binance)是全球领先的数字资产交易平台之一,为用户提供安全、稳定、便捷的数字货币交易服务。它支持多种主流及新兴的数字资产,并提供丰富的交易工具和功能。 本文将为您提供币安2025安卓最新版本的官方下载入口,您只需点击文中给出的下载链接,即可获取官方正版app安装包,开启您的数字资产之旅。…

    2026年5月10日 用户投稿
    000
  • 谷歌搜索的鼠标悬停阴影效果是如何实现的?

    谷歌搜索悬停阴影效果解析 在谷歌搜索页面中,当鼠标悬停在搜索框或按钮上时,会出现一个微妙的边缘阴影。想要了解这一效果的实现原理,许多开发者可能率先想到使用 css。 css 探索 遗憾的是,在 css 代码中无法找到与阴影效果直接相关的属性或值。继续探索其他实现方法。 浏览器开发者工具助力 使用浏览…

    2025年12月24日
    000
  • 如何用 CSS 实现谷歌搜索框鼠标悬停时的边缘阴影效果?

    谷歌搜索框鼠标悬停时边缘阴影效果实现 对于谷歌搜索框在鼠标悬停时的边缘阴影效果,你可能找不到直接的 css 代码,但这种效果可以通过 box-shadow 属性实现。 box-shadow 可以创建箱子周围的阴影效果,它的语法如下: box-shadow: h-offset v-offset blu…

    2025年12月24日
    800
  • 如何实现谷歌搜索框鼠标悬停时的边缘阴影效果?

    如何实现谷歌搜索框鼠标悬停时的边缘阴影效果? 在谷歌搜索中,当鼠标悬停在搜索框和按钮上时,会产生一种精致的边缘阴影效果。实现这一效果需要使用 css 的 box-shadow 属性。 box-shadow 属性 box-shadow 属性允许在元素周围创建阴影效果。其语法为: box-shadow:…

    2025年12月24日
    600
  • 鼠标悬停时,谷歌搜索元素的阴影效果是如何实现的?

    鼠标悬停时突出显示谷歌搜索元素的阴影效果是如何实现的 该效果是通过 css 的 box-shadow 属性实现的,该属性用于在元素周围创建阴影效果。 当鼠标悬停在元素上时,应用 :hover 伪类,并添加 box-shadow 属性,为元素指定阴影效果。 下面是一个示例 css 代码,它给谷歌搜索框…

    2025年12月24日
    500
  • CSS 砌体 Catness

    css 就像技术中的其他东西一样 – 它总是在变化和发展。该领域正在进行的开发是 css 网格布局模块级别 3,也称为 css masonry 布局。 theo 制作了一段视频,介绍了它的开发方式以及苹果和谷歌就如何实施它进行的辩论。 所有这些让我很高兴尝试 css 砌体! webkit…

    用户投稿 2025年12月24日
    000

发表回复

登录后才能评论
关注微信