三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

程序猿 • 2025年11月26日 17:14:23 • 用户投稿 • 阅读 1

该团队的新模型在多个基准测试中都与 Gemini Pro 、GPT-3.5 相媲美。

如果你经常读 AI 大模型方向的论文，Yi Tay 想必是一个熟悉的名字。作为前谷歌大脑高级研究科学家，Yi Tay 为许多知名的大型语言模型和多模态模型做出了贡献，包括 PaLM、UL2、Flan-U-PaLM、LaMDA/Bard、ViT-22B、PaLI、MUM 等。

根据 Yi Tay 个人资料统计，在谷歌大脑工作的 3 年多的时间里，他总共参与撰写了大约 45 篇论文，是其中 16 篇的一作。一作论文包括 UL2、U-PaLM、DSI、Synthesizer、Charformer 和 Long Range Arena 等。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

和大多数离开谷歌自主创业的 Transformer 作者一样，Yi Tay 在去年 3 月份宣布离开谷歌，并参与创办了一家名为 Reka 的公司，Yi Tay 担任该公司的首席科学家，主攻大型语言模型。

随着时间的推移，刚刚，Yi Tay 宣布他们发布了新模型：

三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

「很高兴与大家分享 Reka Flash，这是一种具有 SOTA 性能的、全新的 21B 多模态模型，该模型在语言和视觉基准方面可与 Gemini Pro 和 GPT 3.5 相媲美。我们用相对有限的资源从零开始训练这个模型…… 与此同时，我们规模最大、功能最强的模型 Reka-Core 也即将完成，大家可以对我们接下来的工作期待一下。」

Reka Flash：一个高效的多模态语言模型

Reka Flash 参数量为 21B，完全从头开始训练，其性能可与更大规模的模型相媲美，在众多语言和视觉基准测试中，Reka Flash 与 Gemini Pro 和 GPT-3.5 具有竞争力。

此外， Reka 团队还提出了一个更紧凑的模型变体 Reka Edge，该模型参数量更少，只有 7B，并且效率更高，使其在资源受限（例如，在设备上、本地）的场景下也能运行。

值得一提的是，这两种模型均处于公开测试阶段，感兴趣的读者可以前去尝试。

试用地址：https://chat.reka.ai/auth/login

与此同时，Reka 团队宣布他们最大、功能最强的 Reka Core 模型将在未来几周内向公众推出。

至于开源问题，该团队表示还在考虑当中。

评估：语言

评估基准包括 MMLU（基于知识的问答）、GSM8K（推理和数学）、HumanEval（代码生成）和 GPQA（Google-proof graduate-level question answering）。

结果显示，Reka Flash 在这些基准测试中取得了非常出色的成绩：在 MMLU 和 GPQA 上优于 Gemini Pro，在 GSM8K 和 HumanEval 上取得了具有竞争力的结果。此外，在这些评估中，Reka Flash 明显优于许多较大的模型（例如 Llama 2 70B、Grok-1、GPT-3.5）。

评估：多语言推理

Reka Flash 在超过 32 种语言（包括英语，德语，中文，日语，法语，韩语，西班牙语，意大利语，阿拉伯语等）的文本上进行了预训练，因此 Reka Flash 可以看做是一个强大的多语言模型。研究者比较了不同模型在多语言基准上的性能，包括多语言常识推理、因果推理和问答。结果表明，Reka Flash 在所有这些任务上均优于 Llama-2 70B 和 Mixtral。

评估：视觉和视频

此外，该研究还在多模态基准上对 Reka Flash 进行了评估，包括视觉问答（MMMU、VQA-v2）、视频字幕（VATEX）和视频问答（Perception Test）。结果表明 Reka Flash 在所有四个基准测试中都比 Gemini Pro 具有竞争力。

该研究还进行了一系列人工评估来评估基于 Reka Flash 的聊天模型。研究者考虑了两种设置，1）纯文本聊天模型和 2）多模态聊天模型。评估过程中他们按照 Askell 等人的方法计算 ELO 分数和总体胜率。

纯文本聊天：研究者以 GPT-4、Claude 2.1 和 Gemini Pro（API 版本）等领先模型为基准。此外研究者还比较了 Reka Edge、Mistral 7B 和 Llama 2 7B 聊天模型的性能。

人工评估结果表明，Reka Flash 取得了具有竞争力的结果，优于 GPT-3.5 Turbo、Claude、Mixtral 和 Gemini Pro。Reka Edge 领先于另外两款 7B 模型，接近 Claude Instant 1.2 的性能。

评估：多模态

该研究还将 Reka Flash 与 GPT4-V、Gemini Pro、Llava-1.6、IDEFICS 80b 和 Adept Fuyu-8B 等多模态语言模型进行了比较。结果表明，Reka Flash 的性能优于除 GPT4-V 之外的所有模型。Reka Edge 也取得了不错的排名，超越了基于 Mistral 7B 的 Llava 1.6 7B，并接近 Gemini Pro 的性能。

7B 参数的 Reka Edge 模型

Reka Edge 是更为紧凑的 7B 模型，专为本地部署和延迟敏感应用程序而设计。在语言评估任务上，该研究报告了其与类似规模模型（即 Mistral 7B 和 Llama-2 7B）的比较。结果表明，Reka Edge 在标准语言基准测试中优于 Llama 2 7B 和 Mistral 7B。

总结

Reka 团队表示他们旨在构建最先进的多模态语言模型，随着 Reka Flash 和 Reka Edge 的发布，他们 AI 蓝图中的最初里程碑已经实现。大家可以期待他们接下来的研究。

参考链接：https://reka.ai/reka-flash-an-efficient-and-capable-multimodal-language-model/

以上就是三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/799153.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

apple免费软件网站 apple苹果官网网站APP下载入口

上一篇 2025年11月26日 17:14:22

MySQL之-双机双向热备份的示例代码

下一篇 2025年11月26日 17:14:24

好文分享

如何用HTML插入标签云组件_HTML CSS3变换与随机颜色生成算法

使用HTML构建标签结构，CSS3添加旋转与过渡效果，JavaScript生成随机HSL颜色并设置字体大小，实现动态交互的标签云组件。要在网页中实现一个动态的标签云组件，结合 HTML、CSS3 变换和随机颜色生成算法，可以按照以下步骤操作。这个组件不仅能提升页面视觉效果，还能通过色彩和旋转增加交…

程序猿
2025年12月23日
0000
好文分享

如何在Go Gin应用中集成前端JavaScript模块（如Sentry）

本文探讨了在Go Gin框架下，通过HTML模板服务前端页面时，如何有效集成JavaScript模块（如Sentry）。针对浏览器不直接支持Node.js模块导入语法的问题，文章详细阐述了利用CDN引入Sentry SDK的解决方案，并提供了具体的代码示例，帮助开发者实现前端错误监控功能，避免了复杂…

程序猿
2025年12月23日
0000
好文分享

html官网浏览入口_html网站设计免费平台

html官网浏览入口在https://www.codepen.io，该平台支持实时预览代码、创建Pen项目、Fork开源示例，可添加外部资源，具备点赞评论收藏等社区互动功能，设有挑战活动与作品集分类，开放API接口，界面简洁适合初学者，在线编写无需配置环境，支持多种预处理器和响应式测试。 html官…

程序猿
2025年12月23日
0000
好文分享

表单中的AI助手怎么集成？如何添加智能填写建议？

表单中添加ai助手的核心是通过前后端协同实现智能填写建议，具体需从后端智能服务构建、前端交互逻辑、性能优化及复杂场景处理等方面入手。首先应根据需求选择合适的ai能力：若仅需关键词匹配，可采用轻量级规则引擎或本地模型；若需语义理解，则调用大型语言模型（llm）api如gpt、文心一言等更为合适。后端需…

程序猿
2025年12月22日
1000
好文分享

html如何修改日期样式

在html中，可以使用“::-webkit-datetime-edit”伪元素选择器来修改日期格式，只需要用该选择器选中元素，在设置具体样式即可，具体语法为“::-webkit-datetime-edit{属性:属性值}”。本教程操作环境：windows7系统、CSS3&&HTML…

程序猿
2025年12月21日
1000
好文分享

单选框的type属性值为什么

单选框的type属性值为“radio”。html type属性可以规定要显示的输入框“”元素的类型；值为“radio”时显示为单选框、“checkbox”时显示为复选框、“select”时显示为下拉式选框等等。本教程操作环境：windows7系统、HTML5版、Dell G3电脑。在HTML中，…

程序猿
2025年12月21日
0000
好文分享

HTML中type是什么意思

在HTML中，type是类型的意思，是一个标签属性，主要用于定义标签元素的类型或文档（脚本）的MIME类型；例在input标签中type属性可以规定input元素的类型，在script标签中type属性可以规定脚本的MIME类型。本教程操作环境：windows7系统、html5版、Dell G3电…

程序猿
2025年12月21日
0000
HTML中ul标签如何去掉点？HTML无序列表的样式实例解析

本篇文章主要讲述的是关于html中的ul标签的默认小点给取消掉，还有关于html的无序列表ul标签的样式解释，给出了ul标签中的type属性三种值的介绍。现在就让我们一起来看本篇文章吧首先这篇文章一开始我们就开始介绍在html中是怎么把ul标签的点给去掉的：大家应该都使用过ul无序列表标签，ul…

程序猿
2025年12月21日 • 好文分享
1000
html中的ol标签如何去掉标号呢？标签的使用方法总结

本篇文章介绍了html的ol标签是怎么去掉序号标号的，这里还有代码的详细解释，还有介绍了关于html ol有序列表标签如何更改序号，下文介绍了三种序号，大家也可以自己去想填写怎样的序号。现在来看这篇文章吧一、我们先看看html中的ol标签是如何去掉标号的呢：我们都知道html的ol标签是个有序列…

程序猿
2025年12月21日 • 好文分享
0000
好文分享

HTML ul标签的什么意思？HTML ul标签的作用详解

本篇文章主要的为大家讲解了关于html ul标签的三种重要的用法，还有关于html ul标签的解释，包含li标签的还有type属性对ul标签的使用情况，好了，下面大家一起来看文章吧首先让我们先来解释一下HTML ul标签的意思： ul标签定义的是表格当中无序列表，表格当中的无序列表都是在标签之中…

程序猿
2025年12月21日
0000
好文分享

javascript框架和库是什么_如何选择React、Vue或Angular？

JavaScript框架与库分别提供按需调用的功能集合和约束性开发结构；React是UI组件库，生态灵活但需自行整合工具；Vue渐进式易上手，兼顾原型与工程化；Angular是全功能TypeScript框架，适合强规范企业级项目。 JavaScript框架和库是封装好的代码集合，用来简化前端开发——…

程序猿
2025年12月21日
0000
好文分享

React应用生产环境环境变量配置深度指南

本文针对react应用在生产环境中无法读取`.env`文件配置的环境变量问题，深入剖析其工作原理、常见原因及排查方法。通过详细的步骤和示例代码，指导开发者正确配置和使用环境变量，解决api调用层面的`null`响应问题，确保应用在生产环境下的稳定运行。在React应用开发中，环境变量（如API密钥…

程序猿
2025年12月21日
0000
好文分享

JS注解怎么实现文档化_ JS注解生成开发文档的流程与工具

JSDoc是一种JavaScript结构化注释规范，通过@param、@returns等标签描述代码元素，并借助工具生成HTML文档，结合IDE支持和CI/CD可提升团队协作效率。 JavaScript本身不支持原生注解（Annotation）像Java那样的语法，但通过约定的注释格式和配套工具，可…

程序猿
2025年12月21日
0000
好文分享

JS注解怎么标注联合类型_ JS联合类型的注解书写与使用技巧

在JavaScript中可通过JSDoc使用联合类型注解，如string|number表示多类型支持，结合@param、@typedef等标签提升代码可读性与编辑器提示，适用于函数参数、返回值等场景。在JavaScript中，虽然原生不支持类型注解，但在使用JSDoc配合现代编辑器（如VS Cod…

程序猿
2025年12月21日
0000
好文分享

VS Code主题开发：告别JSON，拥抱脚本化生成

vs code主题扩展最终需json格式定义，但开发者可通过javascript或typescript等脚本语言生成此json文件。这种方法有效解决了大型json文件难以维护、不支持注释等问题，并能实现颜色动态计算，显著提升主题开发的灵活性与效率。为什么选择脚本化生成VS Code主题？在开发V…

程序猿
2025年12月20日
0000
好文分享

如何用Quasar框架开发一个跨平台应用？

Quasar基于Vue.js用一套代码构建多平台应用，支持响应式网站、PWA、移动App和桌面应用。通过quasar create创建项目，利用模式（SPA、PWA、Electron等）切换目标平台，使用Quasar组件库编写通用UI，配合Pinia管理状态，最后通过不同构建命令发布到各平台，实现高…

程序猿
2025年12月20日
1000
好文分享

怎么利用JavaScript进行前端代码覆盖率统计？

答案：利用JavaScript进行前端代码覆盖率统计的核心是通过Istanbul/nyc等工具对代码插桩，结合测试框架收集执行数据并生成报告。具体流程包括：在代码执行前通过Babel或Webpack插件（如babel-plugin-istanbul）插入计数器实现插桩；运行测试时记录哪些代码被执行；…

程序猿
2025年12月20日
1000
好文分享

如何将兰链用于AI工作流程自动化

引言在飞速发展的AI领域，自动化是提升效率和可扩展性的关键。LangChain是一个开源框架，它提供强大的工具，用于将大型语言模型（LLM）集成到应用程序中。无论您是构建聊天机器人、数据处理管道还是智能决策系统，LangChain都能通过无缝连接不同的组件，实现AI工作流的自动化。本文将探讨如何利…

程序猿
2025年12月19日
0000
好文分享

Netflix，但更好

免责声明：本项目与Netflix无关，仅为技术实验。超越Netflix：构建更智能的电影推荐系统 Netflix作为流媒体巨头，拥有超过2亿用户和17000多部电影及电视节目，其推荐系统功不可没。该系统基于用户观看历史、相似节目、用户趋势和热门剧集等数据进行推荐。但如果我们能以更简便的方式复制这一…

程序猿
2025年12月19日
0000
好文分享

如何在双子座AI中生成结构化输出（JSON，YAML）

本文介绍如何使用google gemini api快速生成高质量的api文档，并演示如何灵活地输出json或yaml格式的结果。作者shrijith venkatrama，hexmos创始人，分享了liveapi的构建过程，这是一个通过代码生成api文档的强大工具。步骤1：获取Gemini API…

程序猿
2025年12月19日
0000

发表回复

登录后才能评论

三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

关于作者

相关推荐

发表回复