用有限的资源微调 LLAMA 或文本分类

用有限的资源微调 llama 或文本分类

我最近需要对工作中的特定用例进行句子分类。记得 jeremy howard 的第 4 课:针对绝对初学者的 nlp 入门,我首先改编了他的笔记本来微调 deberta。

它有效,但并不令我满意,所以我很好奇如果我使用像 llama 3 这样的 llm 会发生什么。问题是什么? gpu 资源有限。我只能访问 tesla/nvidia t4 实例。

研究让我找到了 qlora。这个关于使用 qlora 微调 llama 3 llm 进行股票情绪文本分类的教程特别有用。为了更好地理解本教程,我将第 4 课改编成 qlora 教程笔记本。

qlora 使用两种主要技术:

量化:降低模型精度,使其更小。lora(低阶适应):添加小型可训练层,而不是微调整个模型。

这使我能够在 16gb vram t4 上训练 llama 3 8b,使用大约 12gb 的 vram。结果出奇的好,预测准确率超过90%。

Confusion Matrix:[[83  4][ 4  9]]Classification Report:              precision    recall  f1-score   support         0.0       0.95      0.95      0.95        87         1.0       0.69      0.69      0.69        13    accuracy                           0.92       100   macro avg       0.82      0.82      0.82       100weighted avg       0.92      0.92      0.92       100Balanced Accuracy Score: 0.8231653404067196Accuracy Score: 0.92

这是详细介绍该过程的 ipython 笔记本。

这种方法表明可以在有限的硬件上使用大型语言模型。在限制条件下工作通常会带来创造性的问题解决和学习机会。在这种情况下,这些限制促使我去探索和实施更高效的微调技术。

以上就是用有限的资源微调 LLAMA 或文本分类的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1348114.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 11:45:12
下一篇 2025年12月10日 19:55:52

相关推荐

  • 在 AWS Lambda 中使用 Application Load Balancer (ALB) 时获取实际客户端 IP

    当我刚接触 aws 时,我在执行对文档进行数字签名的任务时遇到了一个有趣的挑战,该任务需要客户的 ip 作为电子签名的一部分。最初,当第一次实现似乎完美运行时,我感到很兴奋。然而,我的兴奋是短暂的。在测试过程中,我注意到即使我从不同的机器访问应用程序,也会返回相同的 ip 地址。就在那时,我意识到我…

    2025年12月13日
    000
  • Python教程的努力成果——四

    from meimayakkam_ruleset import *print (“மெய்ம்மயக்கம் விளையாட்டை விளையாடலாமா”)print (“மெய்ம்மயக்க விளையாட்டை விளையாடப் படிநிலைகளுள் ஒன்றைத் தெரிவுசெய…

    2025年12月13日
    000
  • 通过Python培训课程取得的成果——三

    from MeiMayakkam_Ruleset import *print (“மெய்ம்மயக்கம் விளையாட்டை விளையாடலாமா”)print (“மெய்ம்மயக்க விளையாட்டை விளையாடப் படிநிலைகளுள் ஒன்றைத் தெரிவுசெய…

    2025年12月13日
    000
  • 通过Python教程取得的成果 – 一

    from meymayakkamfinal1 import *print (“மெய்ம்மயக்கம் விளையாட்டை விளையாடலாமா”)print (“மெய்ம்மயக்க விளையாட்டை விளையாடப் படிநிலைகளுள் ஒன்றைத் தெரிவுசெய்க…

    2025年12月13日
    000
  • 字符串和尾随逗号,耦合并成为,Tuple ():将错误复制并粘贴到错误和概念

    今天,我将讲述一个关于我的复制粘贴错误的故事,以及如何在我的 python 程序中将带有逗号的字符串耦合并成为 tuple()。奇怪的是,在犯这个错误之前我并不是没有意识到这个概念。 那么,让我们开始快速学习 python 中的字符串和元组。 细绳 定义: 用于存储和操作文本的字符序列。语法: 用单…

    2025年12月13日
    000
  • 使用自定义 Django 命令自动重新加载 Celery 工作线程

    celery 之前有一个 –autoreload 标志,现已被删除。然而,django 在其manage.py runserver 命令中内置了自动重新加载功能。 celery workers 中缺乏自动重新加载会造成令人困惑的开发体验:更新 python 代码会导致 django 服务…

    2025年12月13日
    000
  • “从概念到代码:使用 Python 构建提醒应用程序”

    大家好!我很高兴向您介绍我的最新项目 Promptly – 一款桌面提醒应用程序,旨在帮助您掌握任务和事件。这个项目结合了我对编码的热情和高效时间管理的实际需求。 项目概况: 在忙碌的生活中,我们很容易忘记重要的任务和事件。及时赶到是为了确保不会发生这种情况。借助 Promptly,您可以为任务设置…

    2025年12月13日
    000
  • Python 中的并发和并行编程(课程)

    刚刚完成了有关 Python 并发和并行编程的精彩课程,我很高兴分享我的经验!作为首席工程师,我一直在寻找优化性能和扩展知识的方法。 Max S 在 Udemy 上开设的这门课程是对异步编程、并行计算和线程的精彩回顾。 突出之处: 对复杂概念的清晰解释实际的、真实的例子动手编码的机会 讲师轻松分解 …

    2025年12月13日
    000
  • 在 C# NET 代码库中实现 Bootstrap 现代化:来自 o 5 的 Python 支持的迁移

    介绍 作为一名开发人员,我最近发现自己面临着一个令人兴奋的挑战:对仍在使用 bootstrap 3 的旧版 c# .net 代码库进行现代化改造。目标很明确 – 使用最新的 bootstrap 5 加快项目速度。但是,我很快就意识到实现如此重大的飞跃可能会充满风险且耗时。 就在那时我决定…

    2025年12月13日
    000
  • 通过单一提示构建和部署 AI 支持的 Web 服务

    在 shuttle,我们一直在开发一种新工具,我们认为它可以改变开发人员处理 ai 集成的方式。我们将其称为 shuttleai,它允许您通过单个提示构建和部署人工智能驱动的 web 服务。 这是 tl;dr: 用通俗易懂的语言描述您的人工智能服务shuttleai 生成项目规范供您查看批准或修改规…

    2025年12月13日
    000
  • 让我们制作一个计算器

    在我们真正制作计算器之前,我们先来看看一些基本的数学表达式… 1.添加 num1 = 2num2 = 3print(num1+num2) 5 2.减去 num1 = 7num2 = 5print(num1-num2)2 3.乘法 num1 = 5num2 = 5print(num1*nu…

    2025年12月13日
    000
  • Python – 运算符和条件

    在这篇博客中,我们将了解运算符、条件和 input() 函数。让我们进入运营商吧。 什么是运算符? 在计算机中执行特定数学/逻辑运算的符号。这有 3 种类型,即: 算术运算符比较运算符逻辑运算符 这些是什么以及它们执行什么功能? 让我告诉你一些事情,你们会惊讶地发现它是多么简单…&#82…

    2025年12月13日
    000
  • 运算符、条件、输入()

    *算术运算符* Python 中的六种算术运算符是:加法 (+)、减法 (-)、乘法 ()、除法 (/)、模 (%) 和指数 (*)。这些运算符允许您对数字数据类型(例如整数和浮点数)执行数学运算。 *比较运算符* 比较运算符用于比较两个值: ==, !=, =, >, 逻辑运算符.. Pyt…

    2025年12月13日
    000
  • Python:print() 方法

    大家好,今天学习了Python的print语句。知道Python有这么多的功能真是令人着迷。我将分享我今天学到的一些东西 sep,sep参数与print()函数一起使用,用于指定打印多个参数时的分隔符。转义序列如n(新行),t(添加空格),b(删除前一个字符)。串联 添加两个不同的字符串。连接 st…

    2025年12月13日
    000
  • 全面的 Python 数据结构备忘单

    全面的 python 数据结构备忘单 目录 列表元组套装词典弦乐数组堆栈排队链接列表树堆图表高级数据结构 列表 列表是有序的、可变的序列。 创建 empty_list = []list_with_items = [1, 2, 3]list_from_iterable = list(“abc”)lis…

    2025年12月13日
    000
  • 高级 Python 概念:综合指南

    高级 python 概念:综合指南 目录 简介装饰器生成器和迭代器上下文管理器元类结论 一、简介 python 是一种多功能且强大的编程语言,提供广泛的高级功能。本白皮书探讨了四个关键的高级概念:装饰器、生成器和迭代器、上下文管理器和元类。这些功能使开发人员能够编写更高效、可读和可维护的代码。虽然这…

    2025年12月13日
    000
  • Python Try-Except:何时避免它

    python 的 try- except 块是处理异常和防止程序因运行时错误而崩溃的强大工具。但是,如果过度或不恰当地使用 try- except 块,它们可能会产生比它们解决的问题更多的问题。 本博客提到了一些应该避免的情况,以保持良好的编码实践。 隐藏错误 使用 try- except 块的主要…

    2025年12月13日
    000
  • 免费编程备忘单集合

    在编程世界中,备忘单是每个开发人员的秘密武器。无论您是初学者还是经验丰富的程序员,这些备忘单都可以帮助您快速找到所需的信息并提高您的工作效率。今天,我们整理了编程备忘单的终极集合,涵盖从 Python 到 Docker 的各种语言和工具。请务必将此页面加入书签! 1.Python Python是一种…

    2025年12月13日
    000
  • 避免 Python 中的剽窃:提示和工具

    编写 python 代码是令人愉快的,但请注意警告:您的代码必须是原创的;你不应该盲目地复制别人的代码。如果有,则被视为抄袭。 存在称为 Python 抄袭检查器的在线工具,可用于检测相似代码,但避免抄袭的最佳方法是在编码时保持警惕。以下是一些简单的提示: 在开始编码之前,总是花一些时间来理解问题想…

    2025年12月13日
    000
  • 任何机器上的 ssh-copy-id 命令

    强化 Linux 机器的第一步是启用无密码登录并禁用基于密码的身份验证。 但是,无密码登录需要一对公共/私有 SSH 密钥,并且公共密钥应复制到服务器并存储在位于用户主目录内的 .ssh 文件夹中名为authorized_keys 的文件中。 一种简单的方法是使用名为 ssh-copy-id 的命令…

    2025年12月13日
    000

发表回复

登录后才能评论
关注微信