深入探讨模型、数据和框架:一份详尽的54页高效大语言模型综述

大规模语言模型(LLMs)在许多重要任务中展现出了引人注目的能力,包括自然语言理解、语言生成和复杂推理,并对社会产生了深远的影响。然而,这些出色的能力却需要大量的训练资源(如左图所示)和较长的推理时间(如右图所示)。因此,研究人员需要开发有效的技术手段来解决它们的效率问题。

此外,从图的右侧还可以看出,一些高效的LLMs(Language Models)如Mistral-7B,已经成功应用于LLMs的设计和部署中。这些高效的LLMs在保持与LLaMA1-33B相近的准确性的同时,能够大大减少推理内存使用和降低推理时延。这表明已经有一些可行的高效方法成功地应用于LLMs的设计和使用上。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

在本综述中,来自俄亥俄州立大学、帝国理工学院、密歇根州立大学、密西根大学、亚马逊、谷歌、Boson AI、微软亚研院的研究者提供了对高效 LLMs 研究的系统全面调查。他们将现有优化 LLMs 效率的技术分成了三个类别,包括以模型为中心、以数据为中心和以框架为中心,总结并讨论了当下最前沿的相关技术。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

论文:https://arxiv.org/abs/2312.03863GitHub: https://github.com/AIoT-MLSys-Lab/Efficient-LLMs-Survey 

为了方便整理综述中所涉及的论文,并保持更新,研究者创建了一个 GitHub 仓库,并积极维护。他们希望这个仓库能够帮助研究人员和从业者系统地了解高效 LLMs 的研究和发展,并激发他们为这个重要而令人兴奋的领域做出贡献。

仓库的网址是https://github.com/aiot-mlsys-lab/efficient-llms-survey。在这个仓库中,你可以找到关于高效低功耗机器学习系统的调查的相关内容。这个仓库提供了一些研究论文、代码和文档,帮助人们更好地了解和探索高效低功耗的机器学习系统。如果你对这个领域感兴趣,可以通过访问这个仓库来获取更多的信息。

豆包大模型 豆包大模型

字节跳动自主研发的一系列大型语言模型

豆包大模型 834 查看详情 豆包大模型

以模型为中心

以模型为中心的方法关注算法层面和系统层面的高效技术,其中模型本身是焦点。由于 LLMs 具有数十亿甚至数万亿的参数,与规模较小的模型相比,它们具有诸如涌现等独特的特征,因此需要开发新的技术来优化 LLMs 的效率。本文详细讨论了五类以模型为中心的方法,包括模型压缩、高效预训练、高效微调、高效推理和高效模型架构设计

1. 压缩模型在机器学习领域,模型的大小通常是一个重要的考量因素。大型的模型往往需要更多的存储空间和计算资源,而且在移动设备上运行时可能会遇到限制。因此,压缩模型是一种常用的技术,可以减小模型的大小

模型压缩技术主要分为了四类:量化、参数剪枝、低秩估计和知识蒸馏(参见下图),其中量化会把模型的权重或者激活值从高精度压缩到低精度,参数剪枝会搜索并删除模型权重中较为冗余的部分,低秩估计会将模型的权重矩阵转化为若干低秩小矩阵的乘积,知识蒸馏则是直接用大模型来训练小模型,从而使得小模型在做某些任务的时候具有替代大模型的能力。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

2. 高效预训练

预训练 LLMs 的成本非常昂贵。高效预训练旨在提高效率并降低 LLMs 预训练过程的成本。高效预训练又可以分为混合精度加速、模型缩放、初始化技术、优化策略和系统层级的加速。

混合精度加速通过使用低精度权重计算梯度、权重和激活值,然后在将其转换回高精度并应用于更新原始权重,从而提高预训练的效率。模型缩放通过使用小型模型的参数来扩展到大型模型,加速预训练的收敛并降低训练成本。初始化技术通过设计模型的初始化取值来加快模型的收敛速度。优化策略是重在设计轻量的优化器来降低模型训练过程中的内存消耗,系统层级的加速则是通过分布式等技术来从系统层面加速模型的预训练。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

3. 高效微调

高效微调旨在提高 LLMs 微调过程的效率。常见的高效微调技术分为了两类,一类是基于参数高效的微调,一类是基于内存高效的微调。

基于参数高效微调(PEFT)的目标是通过冻结整个 LLM 主干,仅更新一小组额外的参数,将 LLM 调整到下游任务。在论文中,我们又将 PEFT 详细分成了基于适配器的微调、低秩适配、前缀微调和提示词微调。

基于内存的高效微调则是重在降低整个 LLM 微调过程中的内存消耗,比如减少优化器状态和激活值等消耗的内存。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

4. 高效推理

高效推理旨在提高 LLMs 推理过程的效率。研究者将常见的高效推理技术分成了两大类,一类是算法层级的推理加速,一类是系统层级的推理加速。

算法层级的推理加速又可以分成两类:投机解码和 KV – 缓存优化。投机解码通过使用较小的草稿模型并行计算令牌,为较大目标模型创建猜测性前缀,从而以加速采样过程。KV – 缓存优化指的是优化在 LLMs 推理过程中 Key-Value(KV)对的重复计算。

系统层级的推理加速则是在指定硬件上优化内存访问次数,增大算法并行量等来加速 LLM 的推理。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

5. 高效模型架构设计

对 LLMs 进行高效架构设计是指通过策略性优化模型结构和计算过程,以提高性能和可扩展性,同时最小化资源消耗。我们将高效的模型架构设计依据模型的种类分成了四大类:高效注意力模块、混合专家模型、长文本大模型以及可替代 transformer 的架构。

高效注意力模块旨在优化注意力模块中的复杂计算及内存占用,混合专家模型(MoE)则是通过将 LLMs 的某些模块的推理决策使用多个小的专家模型来替代从而达到整体的稀疏化,长文本大模型是专门设计来高效处理超长文本的 LLMs, 可替代 transformer 的架构则是通过重新设计模型架构,来降低模型的复杂度并达到后 transformer 架构相当的推理能力。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

以数据为中心

以数据为中心方法侧重于数据的质量和结构在提高 LLMs 效率方面的作用。研究者在本文中详细讨论了两类以数据为中心的方法,包括数据选择和提示词工程

1. 数据选择

LLMs 的数据选择旨在对预训练 / 微调数据进行清洗和选择,例如去除冗余和无效数据,达到加快训练过程的目的。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

2. 提示词工程

提示词工程通过设计有效的输入(提示词)来引导 LLMs 生成期望的输出,它的高效之处在于可以通过设计提示词,来达到和经过将繁琐的微调相当的模型表现。研究者将常见的的提示词工程技术分成了三大类:少样本的提示词工程、提示词压缩和提示词生成。

少样本的提示词工程通过向 LLM 提供有限的示例集以引导其对需要执行的任务进行理解。提示词压缩是通过压缩冗长的提示输入或学习和使用提示表示,加速 LLMs 对输入的处理。提示词生成旨在自动创建有效的提示,引导模型生成具体且相关的响应,而不是使用手动标注的数据。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

以框架为中心

研究者调查了近来较为流行的高效 LLMs 框架,并列举了它们所能优化的高效任务,包括预训练、微调和推理(如下图所示)。

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

总结

在这份调查中,研究者为大家提供了一份关于高效 LLMs 的系统性回顾,这是一个致力于使 LLMs 更加民主化的重要研究领域。他们一开始就解释了为什么需要高效 LLMs。在一个有序的框架下,本文分别从以模型的中心、以数据的中心和以框架为中心的角度分别调查了 LLMs 的算法层面和系统层面的高效技术。

研究者相信,在 LLMs 和以 LLMs 为导向的系统中,效率将发挥越来越重要的作用。他们希望这份调查能够帮助研究人员和实践者迅速进入这一领域,并成为激发新的高效 LLMs 研究的催化剂。

以上就是深入探讨模型、数据和框架:一份详尽的54页高效大语言模型综述的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/441586.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 18:49:19
下一篇 2025年11月7日 18:53:51

相关推荐

  • 安币交易所app最新版官方下载地址 ba交易所苹果版下载方法

    目录 常用几种下载方式1. 官方网站下载2. 应用商店下载3. 版本与安全验证4. 安装后操作如何在币安App注册账户?币安app注册方法币安安全设置如何注册海外appleid海外Apple ID的用处使用海外ID注意事项​注册需准备材料:注册台湾或中国台湾苹果账号教程 通过修改appleid地区的…

    2025年12月8日 好文分享
    000
  • USDT泰达币是什么?为何有脱钩风险?2025年USDT 泰达币完整介绍

    USDT泰达币是什么?2025年USDT 泰达币完整介绍 USDT 泰达币基本信息 中文名称:泰达币 英文名称:Tether USDt 常用缩写: USDT 官网:https://tether.to/  创始人:USDT 最早于2014 年6 月由Brock Pierce, Craig Sellar…

    2025年12月8日
    000
  • 2025年好用的数字货币交易所推荐 十大数字货币交易app最新排名

    2025年十大数字货币交易所排名揭晓,Binance、OKX、Huobi稳居前三。1. Binance为全球最大交易所,支持1000+交易对,手续费低且产品丰富;2. OKX以衍生品交易著称,Web3生态完善,具备闪电交易引擎和隐私保护技术;3. Huobi提供机构级API,支持火币生态链,合规牌照…

    2025年12月8日 好文分享
    000
  • 比特币,经济和资本基金会:PNG观点

    探索比特币作为经济自由基石的可能性,特别是在巴布亚新几内亚(png)等地区,以及其与本地项目的协同效应。 比特币、经济与资本基金会:PNG视角 比特币在全球范围内掀起波澜,它对经济体系的潜在变革尤其在像巴布亚新几内亚(PNG)这样的地区受到关注。比特币是否有可能成为新时代经济结构的基础? 比特币:数…

    2025年12月8日
    000
  • 福特股票,卡迪诺区块链和法律数据:意外的交叉点?

    福特与iagon及cloudcourt合作,在cardano区块链上测试法律数据管理,与此同时,福特股价保持平稳。技术正在改变法律行业的未来吗? 福特股票、Cardano区块链与法律数据:一个不寻常的交汇? 福特、卡尔达诺(Cardano)、法律数据——这些词组合在一起似乎有些奇怪,但它们背后隐藏着…

    2025年12月8日
    000
  • 预货币,比特币和国库策略:一个新时代?

    探索psg的长期加密战略与eyenovia的创新代币炒作,财政部的but coin研究揭示了数字资产整合的新趋势和深层洞察。 预货币、比特币与国库战略:一个新时代? 传统金融体系与数字资产之间的融合正在加速升温!越来越多企业将比特币及其他加密货币纳入其国库管理策略之中。让我们深入探讨围绕Precoi…

    2025年12月8日
    000
  • 虚拟价格潜水:Block3是AI游戏救主吗?

    virtuals协议的虚拟代币价格暴跌,引发对ai游戏未来走向的质疑。block3凭借其人工智能驱动的游戏开发平台,是否将成为行业的新希望? 虚拟资产跳水:Block3能否扛起AI游戏大旗? Virtuals协议的虚拟代币正经历剧烈波动,而Block3是否能为AI游戏领域注入新活力?我们来一探究竟。…

    2025年12月8日
    000
  • 特隆的统治受到挑战? ruvi ai的实用程序和投资回报率预测火花辩论

    特伦即将被淘汰吗? ruvi ai的ai和区块链混合,拥有13,100%的roi预测,正转向头部。我们深入研究效用是否可以在加密游戏中击败炒作。 加密世界的喧嚣,不只是围绕常见的模因币疯狂。当像佩佩(Pepe)这样的代币遭遇阻力时,Tron(TRX)仍在持续推动去中心化应用的发展,但一位新挑战者已登…

    2025年12月8日
    000
  • SEI加密:1层投资组合宝石的波浪

    sei crypto正将重心转向1层区块链领域。了解为何其高速、低成本及创新模式使其成为投资组合中的一颗潜在瑰宝。 SEI加密:乘风破浪的1层宝藏 朋友们,SEI加密正在迅速走红!随着Yei和Takara等DeFi平台的兴起,以及最近提升网络性能的升级发布,SEI已经成为投资者关注的焦点之一。它在T…

    2025年12月8日
    000
  • 鲁维:这是下一个潜在109倍的二手硬币吗?

    加密社区对ruvi ai(ruvi)的关注日益升温,让人不禁联想到binance coin(bnb)早期的成功轨迹。这个结合区块链与人工智能的新项目,是否也能带来类似的高回报? 还记得当初投资BNB所带来的巨大收益吗?如今,加密圈内再次掀起热议,焦点落在了Ruvi AI身上。这个项目是否会复刻BNB…

    2025年12月8日
    000
  • 盖亚(Gaia),分散的人工智能和推论:一个新的边界

    探索gaia,分散的ai与推断技术交汇的新前沿,正以前所未有的方式赋能个体并重塑行业格局。 Gaia、分布式人工智能与推理:开启智能代理新时代 Gaia与分布式AI(DEAI)以及推理能力的结合,正在重新定义AI代理的构建、部署和盈利模式。本文将深入探讨这一新兴领域的重要进展、核心优势及其未来潜力。…

    2025年12月8日
    000
  • XRP,云采矿和区块链:加密访问的新时代

    探索xrp、云挖矿与区块链技术的交汇点,使加密货币收益变得前所未有的轻松。 嘿,加密爱好者们!你有没有想过在睡觉的时候也能赚钱?今天就让我们一起深入了解XRP、云挖矿以及区块链的世界——就像在旧裤子里发现一张二十美元纸币一样令人惊喜,只不过这次更酷。 到底发生了什么? 现在是2025年,加密货币已经…

    2025年12月8日
    000
  • eigenlayer,eigencloud和a16z:在可验证的所有内容上大放异彩

    eigenlayer的eigencloud在a16z的支持下,旨在将区块链级的验证性带给主流开发者,尽管eigen的表现起伏不定。 Eigenlayer、Eigencloud与A16Z:在可验证性的未来大展身手 毫无疑问,Eigenlayer、Eigencloud以及背后的A16Z投资引人注目。Ei…

    2025年12月8日
    000
  • 2025年好用的虚拟币交易所推荐 十大虚拟币交易所平台最新排名

    2025年十大虚拟币交易所排名中,Binance、OKX、Huobi位列前三。1. Binance是全球最大的加密货币交易所,支持600+交易对,提供现货、合约、杠杆等服务,具有低费率和高流动性;2. OKX以衍生品交易领先,永续合约市场份额达35%,具备完善的Web3生态和高安全性;3. Huob…

    2025年12月8日 好文分享
    000
  • SEI价格预测Q4 2025:SEI会达到新的高度吗?

    sei能否延续涨势?基于当前趋势与市场情绪,解读2025年第四季度sei价格走势预测。 SEI 2025年Q4价格展望:是否将迎来新高峰? SEI再次引起广泛关注,其价格形态和链上数据暗示可能出现趋势反转。接下来我们深入探讨这一变化对2025年第四季度SEI价格预测的影响。 最新表现与市场情绪回顾 …

    2025年12月8日
    000
  • Ruvi AI:经审核的以太坊挑战者引起了加密投资者的注意

    ruvi ai:以太坊的潜在挑战者,融合区块链与人工智能技术。其通过审核的代币及成功的预售正引发市场关注。它会是下一个大事件吗? 以太坊一直稳坐加密货币领域的王者宝座,但如今一位新晋选手正在崛起。Ruvi AI凭借其经过审计的代币和亮眼的预售表现,吸引了广泛关注。它是否将成为下一个值得关注的项目? …

    2025年12月8日
    000
  • Ruvi AI:下一个二手硬币,进入低点?

    ruvi ai镜子binance硬币的成功可以吗?查找其区块链 – ai混合动力车,低入口价格和结构化增长模式如何吸引投资者。 Ruvi AI:下一个潜力币,入场门槛低? Ruvi AI因其结合了区块链与AI技术,在预售阶段的低价位以及系统化的增长机制,正逐渐成为市场关注的焦点。它是否能…

    2025年12月8日
    000
  • 币圈公认的十大交易所排名 币圈最好用的交易所

    2025年币圈公认的交易所排名中,Binance、OKX、Huobi稳居前三。1. Binance是全球最大的加密货币交易所,支持600+交易对,提供现货、合约、杠杆等多样化服务,以低费率和BNB生态链为特色,采用多层风控系统保障安全;2. OKX在衍生品交易领域领先,永续合约市场份额达35%,具备…

    2025年12月8日 好文分享
    000
  • 立即购买的加密货币:导航2025年投资格局

    探索加密投资对实用功能、透明度和用户主导发展的变革影响。了解2025年值得关注的顶级加密货币,以及为何当下可能是入场的好时机。 值得入手的加密货币:掌握2025年投资趋势 加密行业持续演进,如今焦点已转向具备真实应用场景和坚实社区基础的数字资产。一起看看2025年的热门项目! 摆脱泡沫:聚焦实际应用…

    2025年12月8日
    000
  • 十大数字货币交易所最新排行 2025数字货币十大交易所榜单汇总

    2025年十大数字货币交易所排名依次为Binance、OKX、Huobi、Coinbase、Kraken、Bybit、KuCoin、Gate.io、Bitget、MEXC。Binance以交易量大、手续费低、产品丰富位居榜首;OKX在衍生品和Web3生态方面表现突出;Huobi凭借机构级服务和全球化…

    2025年12月8日 好文分享
    000

发表回复

登录后才能评论
关注微信