模型
-
自动化所研发无创多模态学习模型,实现大脑信号解码与语义分析
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 论文地址:https://ieeexplore.ieee.org/document/10089190 代码地址:https://github.com/ChangdeDu/BraVL数据地址:ht…
-
预训练无需注意力,扩展到4096个token不成问题,与BERT相当
Transformer 作为 NLP 预训练模型架构,能够有效的在大型未标记的数据上进行学习,研究已经证明,Transformer 是自 BERT 以来 NLP 任务的核心架构。 最近的工作表明,状态空间模型(SSM)是长范围序列建模有利的竞争架构。SSM 在语音生成和 Long Range Are…
-
人大高瓴人工智能学院Nature子刊尝试利用多模态基础模型迈向通用人工智能
最近,中国人民大学高瓴人工智能学院卢志武教授、孙浩长聘副教授、以及院长文继荣教授作为共同通讯作者在国际综合期刊《自然·通讯》(英文名:Nature Communications,简称Nat Commun)上发表题为「Towards Artificial General Intelligence vi…
-
根据arXiv的正式规定,使用ChatGPT等工具作为作者是不允许的
ChatGPT,这款近期发布的文本生成工具,已经在研究界引起了热烈的讨论。它能写出学生作文、总结研究论文、回答问题、生成可用的计算机代码,甚至足以通过医学考试、MBA 考试、司法考试…… 其中一个关键的问题是:ChatGPT 可以被命名为研究论文的作者吗? 现在,来自全球最大预印本发布平台 arXi…
-
AI 大底座,大模型时代的答卷
1. 文心一言的诞生 “文心一言就是在这个全国 AI 领域规模最大的高性能 GPU 集群上完成训练的。” 早在 2021 年 6 月,为了满足未来的大模型训练任务,百度智能云开始规划全新的高性能 GPU 集群的建设,联合 NVIDIA 共同完成了可以容纳万卡以上规模的 IB 网络架构设计,集群中节点…
-
12秒内AI在手机上完成作画!谷歌提出扩散模型推理加速新方法
只需12秒,只凭手机自己的算力,就能拿stable diffusion生成一张图像。 而且是完成了20次迭代的那种。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 要知道,现在的扩散模型基本都超过了10亿参数,想要快速生成一张图片,要么基于…
-
大模型商业的搅局者?除了谷歌和微软,你可能忘记了它!
大模型的商业大戏愈发精彩了,这边是谷歌和 OpenAI 剑拔弩张军备竞赛,那边是各路豪强的大模型应用雪花般的涌来,你方唱罢我登场。 而在这串作为大模型先行者而出现的公司以及研究院的名字中,大家却好像忽视了一个巨头公司,苹果。 在当前这波大模型的浪潮之中,苹果似乎异常沉默。不像 Open AI 与谷歌…
-
一键控制10万多个AI模型,HuggingFace给类ChatGPT模型们做了个「APP Store」
从聊天到编程再到支持各种插件,强大的 ChatGPT 早就不是一个简单的对话助手,而是朝着 AI 界的「管理层」不断前进。 3 月 23 号,OpenAI 宣布 ChatGPT 开始支持各类第三方插件,比如著名的理工科神器 Wolfram Alpha。借助该神器,原本鸡兔同笼都算不准的 ChatGP…
-
UC伯克利LLM准中文排行榜来了!GPT-4稳居第一,国人开源RNN模型冲进前六
前段时间,来自LMSYS Org(UC伯克利主导)的研究人员搞了个大新闻——大语言模型版排位赛! 这次,团队不仅带来了4位新玩家,而且还有一个(准)中文排行榜。 OpenAI GPT-4OpenAI GPT-3.5-turboAnthropic Claude-v1RWKV-4-Raven-14B(开…
-
3.6万亿token、3400亿参数,谷歌大模型PaLM 2细节遭曝光
上周四,在 2023 谷歌 I/O 大会上,谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM 2,并正式发布预览版本,改进了数学、代码、推理、多语言翻译和自然语言生成能力。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Pa…