“Yi Tay:离开Google,踏上创业之路,三年发表16篇高质量论文的科学家”

在 GPT-4 发布的第二天,图灵奖得主 Geoffrey Hinton 贡献了一个精彩的比喻:「毛毛虫从食物中提取营养,然后变成蝴蝶。人们已经提取了数十亿条理解的线索,GPT-4 是人类的蝴蝶。」

短短两周,这只蝴蝶似乎已经在各个领域掀起飓风。相应地,AI 行业迎来了新一波创业潮。其中不乏从谷歌等大厂走出的创业者。

如果你经常读 AI 大模型方向的论文,Yi Tay 想必是一个熟悉的名字。作为谷歌大脑高级研究科学家,Yi Tay 为许多知名的大型语言模型和多模态模型做出了贡献,包括 PaLM、UL2、Flan-U-PaLM、LaMDA/Bard、ViT-22B、PaLI、MUM 等。

根据 Yi Tay 个人的统计,在谷歌大脑的 3.3 年里,他总共参与撰写了大约 45 篇论文,是其中 16 篇的一作。一作论文包括 UL2、U-PaLM、DSI、Synthesizer、Charformer 和 Long Range Arena 等。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

三年16篇一作,谷歌大模型高产研究科学家Yi Tay离职创业

和大多数离开谷歌自主创业的 Transformer 作者一样,Yi Tay 也找到了一个合适的时间点离开,迈向新的人生旅程。

在一篇博客文章里,Yi Tay 官宣了自己离职的消息,并在更新后的个人资料中透露了下一步的动向:参与创办一家名为 Reka 的公司,并担任该公司的首席科学家,主攻大型语言模型。

Yi Tay 还透露,Reka 总部位于旧金山湾区,由强大的前 DeepMind、FAIR、谷歌大脑研究人员和工程师组成的团队共同创立。

除了 Yi Tay,香港大学计算机系助理教授刘琦也在自己的个人主页中提到,他正在参与创建一个名为「Reka」的公司,致力于多模态基础模型的开发。读博期间,刘琦曾在谷歌实习过一段时间,和 Yi Tay 合著过《Quaternion Knowledge Graph Embedding》等论文。

三年16篇一作,谷歌大模型高产研究科学家Yi Tay离职创业

由于「Reka」的官网还没办法打开,我们暂时无法获取关于该公司的更多信息。

在告别谷歌之际,Yi Tay 心怀感激地写下了一篇博客,表示离开谷歌确实有一种毕业的感觉,因为他从谷歌以及他出色的同事、导师、经理那里学到了很多。

谷歌对我来说永远是特别的,因为这是我学会进行真正出色研究的地方。我回想起我第一次加入的时候,当我在如此近的地方看到这么多著名的、有影响力的论文的作者时,我就像一个粉丝遇到了喜欢的明星。这对我来说是一个很大的感官刺激,具有很强的激励性和启发性。直到今天,我依然很感激我能和他们中的许多人一起工作和学习,至少在他们中的大多数人离开之前。

我学到了很多。

从更广泛的角度来看,我了解了进行关键研究的重要性以及如何推动研究朝着产生具体影响的目标发展。在大学里,我们只被告知必须投中 N 篇会议论文(才能毕业或做其他事情)。在谷歌,事情必须落地,并且必须产生实际影响。

对我来说,这里最大的启发是关于如何以端到端的方式拥有研究创新过程,即从想法到论文 / 专利,再到生产,最后为用户服务。在很大程度上,我认为这个过程让我成为了一个更好的研究者。

如果一定要形容我的成长,我觉得我的整个研究历程可以说是「平滑的」而不是「突然涌现的」。我认为随着时间的推移,我自己的研究能力逐渐线性提高,因为我变得越来越好,而且我更多地沉浸在谷歌文化中。这就像一个扩散(diffusion)过程。直到今天,我仍然相信研究环境非常重要。

文赋Ai论文 文赋Ai论文

专业/高质量智能论文AI生成器-在线快速生成论文初稿

文赋Ai论文 37 查看详情 文赋Ai论文

大家都说「人」是谷歌最大的福利。我完全同意。我永远感谢我所有亲密的合作者和导师,他们在我作为研究人员和个人的成长过程中发挥了巨大的作用。

从内心深处,我感谢我的现任经理 (Quoc Le) 和我的前任经理 (Don Metzler) 给我机会一起工作,感谢他们一直以来帮助我、照顾我 —— 不仅仅是作为一名下属,也作为一个人。我还要感谢 Ed Chi、Denny Zhou 和 Slav Petrov 等资深人士在整个旅程中对我的支持。最后,我要感谢 Andrew Tomkins,他看中了我,并聘请了我加入 Google。

我还要感谢我最亲密的朋友 / 合作者(Mostafa Dehghani、Vinh Tran、Jason Wei、Hyung Won、Steven Zheng、Siamak Shakeri),感谢他们和我一起度过所有的愉快时光:分享热门话题,相互学习,一起撰写论文,以及讨论研究。​

值得一提的是,在国外掀起 AI 大模型创业潮的同时,国内创业公司也展开了激烈的人才抢夺战。例如有媒体爆出,志在打造中国 OpenAI 的王慧文也在招兵买马,计划收购两家清华 NLP 公司:深言科技、面壁智能。而机器之心 Talent AI 栏目也了解到国内顶级 AI 实验室、多家创业公司以及一批量化投资机构也都在积极寻找大模型人才。

以上就是”Yi Tay:离开Google,踏上创业之路,三年发表16篇高质量论文的科学家”的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/557984.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 23:19:14
下一篇 2025年11月9日 23:20:12

相关推荐

  • 阿里云服务器SSH连接失败但终端可正常使用是什么原因?

    阿里云服务器SSH连接中断,但已连接终端保持可用 近期,一台阿里云服务器出现SSH连接和网站访问间歇性中断的问题,但已建立的终端连接却不受影响。服务器IP可ping通,资源监控显示CPU和内存正常,线程和文件句柄数量也未超出限制。 问题表现为:新SSH连接无法建立,而现有连接仍然保持可用状态。这说明…

    2025年12月10日
    000
  • 如何设计高并发充值系统,确保每分钟处理一单并在3分钟内完成充值并返回结果?

    如何构建高效的每分钟一单,三分钟出结果的充值系统? 本文探讨一个高并发充值系统的架构设计,目标是实现每分钟处理一个充值订单,并在三分钟内完成充值并返回结果。传统方法难以满足此类高并发、低延迟的要求。 传统方案的不足 直接使用同步处理方式,在高并发情况下,系统容易出现瓶颈,导致订单积压和响应时间过长,…

    2025年12月10日
    000
  • PDO预处理语句与GROUP BY冲突:ONLY_FULL_GROUP_BY错误如何解决?

    PDO预处理与MySQL ONLY_FULL_GROUP_BY 模式冲突详解及解决方法 在使用PDO时,将PDO::ATTR_EMULATE_PREPARES设置为false以禁用PHP模拟预处理,可能会导致包含GROUP BY子句的查询出现ONLY_FULL_GROUP_BY错误。 错误现象 当执…

    2025年12月10日
    000
  • MySQL高并发下如何优雅处理用户昵称重复问题?

    巧妙解决MySQL高并发下用户昵称重复问题 为确保用户昵称的唯一性,并在高并发环境下避免含糊不清的注册失败提示,我们可以采用以下策略: 方法一:数据库唯一索引 在MySQL数据库中,为users表中的nickname字段创建唯一索引,从而在插入重复昵称时,数据库会直接返回错误信息,包含”…

    2025年12月10日
    000
  • Vue+PHP登录注册:如何用JSON实现前后端数据交互?

    Vue.js与PHP的JSON数据交互:登录注册功能实现 本文探讨如何利用JSON格式实现Vue.js前端与PHP后端在登录注册功能中的数据交互,包括PHP从数据库读取数据并返回,以及处理POST请求提交数据。 前端(Vue.js) POST请求发送: 以下代码片段展示了如何使用fetch API发…

    2025年12月10日
    000
  • MySQL索引失效:为什么shop_id索引在特定查询条件下失效?

    MySQL索引失效场景分析 本文分析一个MySQL索引失效的案例,并探讨其原因。 数据库表结构如下: CREATE TABLE `ns_delivery_shop` ( `id` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT, `goods_id` INT(10)…

    2025年12月10日
    000
  • 阿里云服务器SSH连接失败但已有连接正常,是什么原因?

    阿里云服务器SSH连接中断,但现有连接保持活跃 问题现象: 阿里云服务器出现间歇性无法SSH连接的情况。80端口网站也无法访问,但已建立的SSH连接却能正常工作。服务器ping通,CPU、内存、带宽资源正常,打开文件数量也无异常。 可能原因: 服务器并发连接数达到上限,导致新的SSH连接无法建立。 …

    2025年12月10日
    000
  • Go语言如何通过API重启Docker容器?

    Go语言与Docker API集成:实现代码变更后自动重启容器 在Swoole开发中,代码更新后快速重启Docker容器至关重要。本文介绍如何使用Go语言和Docker API实现此功能。 解决方案: Go语言的go-dockerclient库提供了与Docker API交互的便捷方式。 立即学习“…

    2025年12月10日
    000
  • ThinkPHP5 Windows服务器缓存写入失败怎么办?

    ThinkPHP5在Windows服务器缓存写入失败的解决方法 许多用户在Windows服务器环境下使用ThinkPHP5框架时,常常遇到缓存写入失败的问题,报错信息通常显示为file_put_contents(C:phpStudyPHPTutorialWWWappruntimecache4f819…

    2025年12月10日
    000
  • PHP 8如何建立安全意识

    PHP 8 的安全意识构建了一个多层次的防御体系,涵盖输入验证、数据过滤、输出编码、安全函数应用以及服务器配置,以应对安全风险,包括 SQL 注入、XSS、CSRF 和文件包含漏洞。通过采用严格的验证、过滤和编码措施,加上安全函数和适当的服务器配置,开发人员可以主动构建安全的应用程序,而非被动地修补…

    2025年12月10日
    000
  • 了解Laravel应用中的坚实原则

    Laravel应用中的SOLID原则:构建更健壮的应用 干净、易于维护的软件设计,其基石在于SOLID原则。这五个原则——单一职责原则(SRP)、开放封闭原则(OCP)、Liskov替换原则(LSP)、接口隔离原则(ISP)和依赖反转原则(DIP)——帮助开发者构建可扩展、可测试且易于维护的系统。本…

    2025年12月10日
    000
  • 在测试中使用Laravel中的PHP后备枚举

    PHP 枚举概述 PHP 8.1 引入了枚举,提供了一种定义命名值集合的结构化方式。Laravel 与枚举无缝集成,允许在模型、验证规则和查询条件中使用它们。然而,在测试中,一些细微之处可能会导致意外的失败。 示例:订单项目状态枚举 这是一个订单项目状态的后备枚举示例: namespace AppS…

    2025年12月10日
    000
  • 优化PHP应用程序:为什么单独阅读和写入模型很重要

    模型是与数据存储交互的理想工具。它们定义数据的结构,确保与数据存储(通常是数据库)兼容。模型不仅验证输入数据,辅助数据写入,还能用于数据检索。然而,除了简单的CRUD应用之外,将同一个模型用于读写通常并非最佳实践。让我们深入探讨原因。 创建模型 让我们以一个简单的用户模型和存储库接口为例,这里无需详…

    2025年12月10日
    000
  • 设计一个数字容器系统

    设计一个高效的数字容器系统,支持以下操作: 插入/替换: 将指定索引处的值替换为新值。如果索引不存在,则插入新值。查找最小索引: 返回给定数字在容器中出现的最小索引。如果数字不存在,则返回 -1。 挑战难度: 中等 相关主题: 哈希表,设计模式,最小堆(优先队列) 示例: [“NumberConta…

    2025年12月10日
    000
  • 与作曲家制作和共享PHP库

    Composer已成为PHP项目依赖管理和代码复用的核心工具。无论您是贡献开源项目还是提升个人开发效率,学习创建Composer包都是一项非常有价值的技能。本文将引导您完成构建和共享个人PHP库的完整流程。 准备工作 在开始之前,请确保您已具备以下条件: 扎实的PHP和Composer基础知识。已在…

    2025年12月10日
    000
  • Laravel注入命令:如何检测和防止它

    Laravel 命令注入漏洞:检测与防御 命令注入是严重的服务器端安全漏洞,允许攻击者执行任意系统命令。如果 laravel 应用在处理系统命令时未妥善处理用户输入,则极易受到此类攻击。本文将深入探讨命令注入,提供代码示例,并讲解如何保护您的 laravel 应用免受此类威胁。 我们还将介绍一款免费…

    2025年12月10日
    000
  • 创建数据库

    项目概述:构建旅游代理信息系统 本项目旨在开发一个基于MySQL数据库的旅游代理信息系统,支持代理商的未来发展和营销策略。系统将管理代理商、客户、住宿信息(公寓、房屋、酒店)、航班信息以及预订等功能。项目团队由3名成员组成,预计完成时间为12小时。最终成果将包含两个虚拟机,并包含数据库、逻辑数据模型…

    2025年12月10日
    000
  • PHP中的PSR-容器接口

    PSR-11 规范定义了 PHP 依赖注入容器的标准接口。这一标准化使得库能够从任何容器实现中检索服务,从而提升不同框架和库之间的互操作性。 理解依赖注入容器 (DIC) 依赖注入容器负责: 管理服务定义创建服务实例解析依赖项管理对象生命周期 容器接口示例 立即学习“PHP免费学习笔记(深入)”; …

    2025年12月10日
    000
  • 拉维尔队列:巴士与链条

    Laravel 队列:提升应用性能的 Bus 和 Chain Laravel 队列用于处理耗时的后台任务,从而提升应用性能。核心概念是 Bus 和 Chain,它们赋予作业控制和链接能力。本文将深入探讨如何利用 Bus 和 Chain 在 Laravel 中构建高效的执行流程。 Laravel Bu…

    2025年12月10日
    000
  • 防止Laravel应用中的比赛条件

    竞争条件:laravel应用中的隐患及解决方案 竞争条件是并发系统(例如Web应用)中一个常见且严重的漏洞,可能导致不可预测的行为。本文将探讨竞争条件的成因、影响以及如何在Laravel框架中有效避免它们。 什么是竞争条件? 竞争条件发生在多个进程同时修改共享数据时,导致结果不可预测。这常见于:文件…

    2025年12月10日
    000

发表回复

登录后才能评论
关注微信