理论
-
中国科学院团队创造了一种统一框架,用于提高酶动力学参数的预测准确性
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | 萝卜皮 酶动力学参数的预测对于生物技术和工业应用中酶的设计和优化至关重要,然而目前的预测工具在各种任务上的有限性能限制了它们的实际应用。 中国科学院的研究人员最近提出了UniKP,这是…
-
揭秘的全新版本:你从未见过的Transformer数学原理
近日,arxiv 上发布了一篇论文,对 Transformer 的数学原理进行全新解读,内容很长,知识很多,十二分建议阅读原文。 2017 年,Vaswani 等人发表的 《Attention is all you need》成为神经网络架构发展的一个重要里程碑。这篇论文的核心贡献是自注意机制,这是…
-
CVPR 2023|美图&国科大联合提出DropKey正则化方法:用两行代码高效避免视觉Transformer过拟合问题
近期,基于 Transformer 的算法被广泛应用于计算机视觉的各类任务中,但该类算法在训练数据量较小时容易产生过拟合问题。现有 Vision Transformer 通常直接引入 CNN 中常用的 Dropout 算法作为正则化器,其在注意力权重图上进行随机 Drop 并为不同深度的注意力层设置…
-
保真度高达~98%,广工大「AI+光学」研究登Nature子刊,深度学习赋能非正交光复用
编辑 | X 在光复用中,通道之间的正交性扮演着至关重要的角色。这种正交性确保了不同通道之间的信号不会相互干扰,从而实现了高效的数据传输。光复用系统能够同时传输多个通道的数据,有效提高了光纤的利用率。然而,这种系统也不可避免地会施加复用容量的上限。 在此,广东工业大学通感融合光子技术教育部重点实验室…
-
Transformer本可以深谋远虑,但就是不做
语言模型是否会规划未来 token?这篇论文给你答案。 「别让 Yann LeCun 看见了。」 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ Yann LeCun 表示太迟了,他已经看到了。今天要介绍的这篇 「LeCun 非要看」的论文探…
-
让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢…
-
参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?
多模态 AI 系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型(如 GPT-4V)的研究取得了重要进展,但如何有效地将图像信息转化为 AI 系统的可执行操作仍面临挑战。为了实现图像信息的转化,一种常见的方法是将图像数据转化为对…
-
ICLR 2024 Spotlight | NoiseDiffusion: 矫正扩散模型噪声,提高插值图片质量
作者 | pengfei zheng 单位 | USTC, HKBU TMLR Group 近年来,生成AI的迅猛发展为文本到图像生成、视频生成等令人瞩目的领域注入了强大的动力。这些技术的核心在于扩散模型的应用。扩散模型首先通过定义一个不断加噪声的前向过程来将图片逐步变为高斯噪声,再通过逆向过程将高…
-
快多个数量级,清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 编辑 | KX 两年前,清华大学物理系徐勇、段文晖研究组开发出高效精确的第一性原理电子结构深度学习方法 DeePH,可极大加速电子结构计算。 近日,该团队开发了一种准确而有效的实空间重构方法(r…
-
整合长期记忆,AI实现自我进化,探索大模型这一可能性
地球上最早的生命证据至少可以追溯到 35 亿年前,而直到大约 25 万到 40 万年前,智人才出现地球上。在这漫长的岁月中,生物不断地兴盛又覆灭,但整体趋势总是越来越复杂,其中最复杂的生物组件莫过于我们智人的大脑。这样的复杂性是我们的意识和智慧的来源。而这一切背后的机制是进化(evolution)。…