模型_第19页

自动化所研发无创多模态学习模型，实现大脑信号解码与语义分析

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 论文地址：https://ieeexplore.ieee.org/document/10089190 代码地址：https://github.com/ChangdeDu/BraVL数据地址：ht…

程序猿

2025年11月9日 • 用户投稿

1000

预训练无需注意力，扩展到4096个token不成问题，与BERT相当

Transformer 作为 NLP 预训练模型架构，能够有效的在大型未标记的数据上进行学习，研究已经证明，Transformer 是自 BERT 以来 NLP 任务的核心架构。最近的工作表明，状态空间模型（SSM）是长范围序列建模有利的竞争架构。SSM 在语音生成和 Long Range Are…

程序猿

2025年11月9日 • 用户投稿

2000

人大高瓴人工智能学院Nature子刊尝试利用多模态基础模型迈向通用人工智能

最近，中国人民大学高瓴人工智能学院卢志武教授、孙浩长聘副教授、以及院长文继荣教授作为共同通讯作者在国际综合期刊《自然·通讯》（英文名：Nature Communications，简称Nat Commun）上发表题为「Towards Artificial General Intelligence vi…

程序猿

2025年11月9日 • 用户投稿

1000

根据arXiv的正式规定，使用ChatGPT等工具作为作者是不允许的

ChatGPT，这款近期发布的文本生成工具，已经在研究界引起了热烈的讨论。它能写出学生作文、总结研究论文、回答问题、生成可用的计算机代码，甚至足以通过医学考试、MBA 考试、司法考试…… 其中一个关键的问题是：ChatGPT 可以被命名为研究论文的作者吗？现在，来自全球最大预印本发布平台 arXi…

程序猿

2025年11月9日 • 用户投稿

13000

AI 大底座，大模型时代的答卷

1. 文心一言的诞生 “文心一言就是在这个全国 AI 领域规模最大的高性能 GPU 集群上完成训练的。” 早在 2021 年 6 月，为了满足未来的大模型训练任务，百度智能云开始规划全新的高性能 GPU 集群的建设，联合 NVIDIA 共同完成了可以容纳万卡以上规模的 IB 网络架构设计，集群中节点…

程序猿

2025年11月9日 • 用户投稿

0000

12秒内AI在手机上完成作画！谷歌提出扩散模型推理加速新方法

只需12秒，只凭手机自己的算力，就能拿stable diffusion生成一张图像。而且是完成了20次迭代的那种。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 要知道，现在的扩散模型基本都超过了10亿参数，想要快速生成一张图片，要么基于…

程序猿

2025年11月9日 • 用户投稿

11000

大模型商业的搅局者？除了谷歌和微软，你可能忘记了它！

大模型的商业大戏愈发精彩了，这边是谷歌和 OpenAI 剑拔弩张军备竞赛，那边是各路豪强的大模型应用雪花般的涌来，你方唱罢我登场。而在这串作为大模型先行者而出现的公司以及研究院的名字中，大家却好像忽视了一个巨头公司，苹果。在当前这波大模型的浪潮之中，苹果似乎异常沉默。不像 Open AI 与谷歌…

程序猿

2025年11月9日 • 用户投稿

0000

一键控制10万多个AI模型，HuggingFace给类ChatGPT模型们做了个「APP Store」

从聊天到编程再到支持各种插件，强大的 ChatGPT 早就不是一个简单的对话助手，而是朝着 AI 界的「管理层」不断前进。 3 月 23 号，OpenAI 宣布 ChatGPT 开始支持各类第三方插件，比如著名的理工科神器 Wolfram Alpha。借助该神器，原本鸡兔同笼都算不准的 ChatGP…

程序猿

2025年11月9日 • 用户投稿

0000

UC伯克利LLM准中文排行榜来了！GPT-4稳居第一，国人开源RNN模型冲进前六

前段时间，来自LMSYS Org（UC伯克利主导）的研究人员搞了个大新闻——大语言模型版排位赛！这次，团队不仅带来了4位新玩家，而且还有一个（准）中文排行榜。 OpenAI GPT-4OpenAI GPT-3.5-turboAnthropic Claude-v1RWKV-4-Raven-14B（开…

程序猿

2025年11月9日 • 用户投稿

0000

3.6万亿token、3400亿参数，谷歌大模型PaLM 2细节遭曝光

上周四，在 2023 谷歌 I/O 大会上，谷歌 CEO 皮查伊宣布推出对标 GPT-4 的大模型 PaLM 2，并正式发布预览版本，改进了数学、代码、推理、多语言翻译和自然语言生成能力。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Pa…

程序猿

2025年11月9日 • 用户投稿

3000