iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

发烧友们已经揭开了苹果transformer的“秘密”

在大型模型浪潮的影响下,即使是保守的苹果公司,在每次发布会上也必定会提及”Transformer”

比如,在今年的WWDC上,苹果就已宣布,船新版本的iOS和macOS将内置Transformer语言模型,以提供带文本预测功能的输入法。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

虽然苹果官方没有透露更多信息,但技术爱好者们却迫不及待

一位名叫Jack Cook的小哥,成功地翻开了macOS Sonoma beta的新篇章,意外地发现了许多新的信息

模型架构上,Cook小哥认为苹果的语言模型更像是基于GPT-2打造的。在分词器(tokenizer)方面,表情符号在其中十分突出。

更多细节,一起来看。

基于GPT-2架构

首先,让我们回顾一下苹果基于Transformer的语言模型在iPhone、MacBook等设备上能够实现的功能

需要重写的内容是:主要体现在输入法方面。在语言模型的支持下,苹果自带的输入法可以实现单词预测和纠错的功能

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

Jack Cook小哥具体测试了一下,发现这个功能主要实现的是针对单个单词的预测。

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发
需要进行改写的内容是:△来源:Jack Cook的博客文章

模型有时也会预测即将出现的多个单词,但这仅限于句子语义十分明显的情况,比较类似于Gmail里的自动完成功能。

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发
需要进行改写的内容是:△来源:Jack Cook的博客文章

那么这个模型具体被装在了哪里?一通深入挖掘之后,Cook小哥确定:

我在 /System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle 中找到了预测文本模型。

原因是:

unilm.bundle中的许多文件在macOS Ventura(13.5)里并不存在,仅出现在了新版本macOS Sonoma beta(14.0)里。unilm.bundle中存在一个sp.dat文件,这在Ventura和Sonoma beta里都能找到,但Sonoma beta的版本中更新了明显像是分词器的一组token。sp.dat中token的数量跟unilm.bundle中的两个文件——unilm_joint_cpu.espresso.shape和unilm_joint_ane.espresso.shape能匹配得上。这两个文件描述了Espresso/CoreML模型中各层的形状。

进一步推测,根据unilm_joint_cpu中描述的网络结构,小哥认为苹果模型是基于GPT-2架构构建的

Giiso写作机器人 Giiso写作机器人

Giiso写作机器人,让写作更简单

Giiso写作机器人 56 查看详情 Giiso写作机器人

主要的组成部分包括令牌嵌入、位置编码、解码器块和输出层,在每个解码器块中都会出现类似于”gpt2_transformer_layer_3d”这样的词汇

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

需要进行改写的内容是:△来源:Jack Cook的博客文章

根据每层大小,小哥还推测苹果模型约有3400万个参数,隐藏层大小为512。换句话说,它比GPT-2最小版本还要小

小哥认为,这主要是因为苹果想要一种不太耗电,但同时能够快速、频繁运行的模型。

而苹果官方在WWDC上的说法是,“每点击一个键,iPhone就会运行模型一次”。

然而,这也意味着这个文本预测模型无法很好地续写句子或段落

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

需要进行改写的内容是:△来源:Jack Cook的博客文章

模型架构之外,Cook小哥还挖出了分词器(tokenizer)的相关信息。

他在unilm.bundle/sp.dat里发现了一组数量为15000的token,值得关注的是,其中包含100个emoji

Cook揭秘库克

虽然这个Cook不是那个库克,但小哥的博客文章一发布,仍然吸引了很多关注

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

基于他的发现,网友们热烈地讨论起苹果在用户体验和前沿技术应用之间的平衡大法。

iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发

回到Jack Cook本人,他本科和硕士毕业于MIT的计算机专业,目前还在攻读牛津大学的互联网社会科学硕士学位。

他之前曾在英伟达实习,专注于研究BERT等语言模型。他还担任《纽约时报》的自然语言处理高级研发工程师

以上就是iPhone中隐藏的机器人:基于GPT-2架构,带有emoji分词器,由MIT校友开发的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/494086.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 17:06:49
下一篇 2025年11月8日 17:07:23

相关推荐

  • 将 Excel 数据集转换为 SQL 插入语句

    利用 python 使将 excel 文件转换为 sql 数据库成为一个简单的过程。 首先,请按照以下步骤将 excel 数据导出到 csv 文件: 打开您的 excel 文件。导航到文件 > 另存为。选择 csv(逗号分隔)(*.csv) 作为文件类型并保存文件。 按照这些简单的说明,您可以…

    2025年12月13日
    000
  • 在 Django 项目中实现具有 Levenshtein Distance 的欺诈检测系统

    编辑距离可用于欺诈检测系统,将用户输入的数据(例如姓名、地址或电子邮件)与现有数据进行比较,以识别类似但可能具有欺诈性的条目。 这是将此功能集成到 django 项目中的分步指南。 1. 用例 欺诈检测系统可以比较: 类似电子邮件:检测创建时略有不同的帐户(例如,user@example.com 与…

    2025年12月13日
    000
  • 如何消除字典打印中的空行?

    解决字典打印中的空行问题 在打印字典时,您可能遇到了中间自动生成空行的问题。这可以通过修改打印语句的格式来解决。 原始代码无法去掉空行,因为 strip(r’n’) 函数只能去除字符串末尾的换行符。 为了去除字典打印中的空行,可以使用如下代码: if __name__ == …

    2025年12月13日
    000
  • 如何将 Python 中的 JSON 字符串转换为 List[Dict]?

    在 python 中将 string 转换为 list[dict] 你想将一个包含 json 格式字符串的字符串转换成 python 中的 list[dict]。要实现这一点,可以使用 json.loads() 函数。 import jsonstr_content = ”'[{“Id”: “Fai…

    2025年12月13日
    000
  • 打印字典时如何消除自动生成的空行?

    打印dict{}时中间空行自动生成问题 在打印dict{}时,可能会出现中间自动生成空行的情况,影响代码美观和阅读性。 根据题主提供的代码: for i in lists: print(i.get(‘column2′).strip(r’n’)) 无法取消空行的问题主要在于,该代码只针对指定键&#82…

    2025年12月13日
    000
  • 如何将 Python 中的字符串转换成包含字典的列表?

    在 python 中转换 string 为 list[dicts] 您需要将一个 string 转换成一个包含字典的 list。为此,可以使用以下步骤: json 解析: 使用 json 模块中的 json.loads() 函数,该函数将 json 字符串解析为 python 字典。类型转换: js…

    2025年12月13日
    000
  • 如何去除打印字典时出现的不必要的空行?

    去掉打印字典时的空行 打印字典时,可能会出现不必要的空行。如果你想去掉这些空行,可以按照以下步骤操作: 首先,使用 dict.values() 方法获取字典的值。这将返回一个包含字典所有值的列表。 接下来,遍历这个值列表,并使用 str.strip() 方法去掉每个值中的多余空行。 以下是修改后的代…

    2025年12月13日
    000
  • Python 中的日期类型转换:显式与隐式转换 | 天蟒

    第 6 天:变量和数据类型 | 100 天 python 100 天编程挑战赛的第 7 天 让我们了解了 python 中的类型转换 的概念。对于许多新开发人员来说,类型转换似乎是一个复杂的主题。然而,经过一些探索,您会发现它是一个重要且简单的工具,可以增强您处理变量和数据的方式。这篇博文将介绍类型…

    2025年12月13日
    000
  • 为 SEO 专家提供的高级验证码绕过技术以及代码示例

    每一位参与数据抓取的 seo 专家都知道,验证码是一个具有挑战性的障碍,限制了对所需信息的访问。但是否值得完全避免,还是学习如何绕过它更好?让我们通过真实的例子和有效的方法来分析验证码是什么,为什么它被如此广泛地使用,以及 seo 专家如何绕过它。 seo 中的验证码绕过:它是什么,它是否被高估了?…

    2025年12月13日
    000
  • Python:算术、数据类型和条件逻辑的基本概念

    如果您是 python 新手,了解基本操作、数据类型和条件逻辑至关重要。让我们回顾一下一些基本主题。我们将通过示例探讨每个主题。 第 1 章:算术运算符 python提供了多种运算符,可以轻松执行数学运算。以下是最常见运算符的快速概述: syntax action example output *m…

    2025年12月13日
    000
  • Python 中批量注释导致 while…else… 报语法错误的原因是什么?

    批量注释导致 while…else… 中 else 报语法错误的原因 在 python 中的批量注释,语法与 c 语言不同。在 c 语言中,以 /* 开始,以 */ 结束的部分为一个注释块。而在 python 中,以 ”’ 开始,以 ”&#…

    2025年12月13日
    000
  • 如何使用 Python 线程池和 Semaphore 避免线程创建导致的内存泄漏?

    如何在 python 线程池中控制线程创建以避免内存泄漏 在您提供的代码中,由于每次执行都创建新的线程,导致线程数量无限增加,最终导致内存泄漏。为了避免这种情况,我们可以使用线程池来管理线程创建。 线程池 线程池是一个预先分配的线程组,可以在任务到来时重复利用。这样可以避免不必要地创建新线程,从而提…

    2025年12月13日
    000
  • 日变量和数据类型 | 天蟒

    第 5 天:评论、转义序列和打印声明 | 100 天 python python 编程对于初学者来说非常直观,学习变量和数据类型的概念是基础。本博客将引导您了解这些要点,为初学者提供一种结构化的方法来理解 python 编程中的变量和数据类型。让我们开始吧! python 中的变量是什么? 在 py…

    2025年12月13日
    000
  • Python 中如何通过函数命名空间定义变量?

    python 中通过函数命名空间定义变量的方法 python 提供了一种通过函数命名空间定义变量的方法,该方法利用了函数作为闭包的能力。 具体而言,可以通过在函数定义中定义一个变量,并在函数外部访问该变量,从而实现变量的定义。如下所示: def fun(): fun.value = 10 # 定义变…

    2025年12月13日
    000
  • 如何使用百度人脸识别API进行人脸匹配?

    调用python人脸识别接口 如果你需要一个可以匹配人脸的python接口,百度人脸识别是一个不错的选择。 百度人脸识别提供了一系列的api,允许开发者使用python与该平台交互。其中包括用于匹配人脸的api。 要使用百度人脸识别api匹配人脸,你需要: 注册一个百度云账号。 [访问百度云注册页面…

    2025年12月13日
    000
  • Python 包管理:你知道它们在哪里吗?

    另一天,我在那里高兴地用 pip 安装一些 python 包,突然我想到了:我刚刚下载了 3gb 的数据,但我不知道它去了哪里!如果您发现自己处于这种情况,欢迎来到俱乐部。让我们一起揭开python包缺失的谜团,并学习如何更好地管理我们宝贵的磁盘空间。 python 包的迷人世界 在我们深入探讨“我…

    2025年12月13日
    000
  • python爬虫怎么过滤超链接

    如何使用 Python 爬虫过滤超链接?有多种方法可以过滤 Python 爬虫中的超链接:正则表达式:使用正则表达式匹配特定模式的 URL。Xpath 查询:使用 Xpath 根据特定的 XML 或 HTML 条件进行选择。CSS 选择器:使用 CSS 选择器从 HTML 文档中选择超链接。函数过滤…

    2025年12月13日
    000
  • 怎么是python爬虫停下来

    有四种方法可以停止 Python 爬虫:通过键盘中断 (Ctrl+C 或 Ctrl+Break)、使用信号处理、使用事件或使用条件变量。 如何停止 Python 爬虫 在进行网络爬取时,有必要能够控制爬虫的运行,包括让它停止。以下是实现此目的的几种方法: 1. 通过键盘中断 最简单的方法是通过键盘中…

    2025年12月13日
    000
  • 如何在共享主机的子目录中托管 Laravel 项目而不在 URL 中暴露“/public”

    在共享主机上托管 laravel 项目时,一个常见的挑战是确保 url 不需要 /public 目录。这是在子目录中托管 laravel 应用程序同时保持 url 干净的分步指南。 第 1 步:将 laravel 项目上传到服务器 登录您的托管帐户并访问您的文件管理器。导航到 public_html…

    2025年12月13日
    000
  • python爬虫怎么拼接网址

    在 Python 爬虫中,网址拼接可通过以下步骤实现:导入库并连接路径组件;添加查询参数,使用 urlparse 和 urlencode 函数;处理特殊字符,使用 quote() 函数进行编码。 如何使用 Python 爬虫拼接网址 拼接网址是指将多个字符串连接起来形成一个完整的网址。在 Pytho…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信