大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

训练大模型时,适度“健忘”反而更聪明!

大语言模型若缺乏约束,容易直接照搬训练数据。为应对这一挑战,马里兰大学、图宾根大学与马普所的研究团队提出了一种新颖方法——金鱼损失(Goldfish Loss)。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

顾名思义,金鱼损失旨在让模型像金鱼一样“记性差”,在计算损失函数时随机忽略一小部分 token

这样一来,模型不再逐字记忆训练内容,但仍能掌握语言结构和规律。

实验结果显示,在应用金鱼损失后,LLaMA-2 模型:

显著减少记忆化行为:几乎不再复现原始训练文本

保持下游任务表现:文本生成依旧流畅自然

正如网友一针见血地评论:这就像 dropout,只不过作用在损失函数上!

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

在梯度更新过程中随机屏蔽部分 token

金鱼损失的核心思想十分直观:在训练阶段,随机剔除输入序列中的一些 tokens,使其不参与损失计算。

这样,当模型在推理时面对被“遗忘”的位置,只能依靠上下文进行推测,而非机械复述训练数据。

为了确保每次遇到相同文本时,被屏蔽的位置保持一致,研究者设计了一种基于哈希(hashing)的掩码机制。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

那么,它与传统的正则化手段有何不同?

以 Dropout 为例,这类方法通过在神经网络中引入噪声,防止模型对特定参数过度依赖,从而提升泛化能力。

但问题在于:如果每次训练时随机丢弃的 token 位置不同,模型可能通过多次观察拼凑出完整句子,本质上仍是“死记硬背”。

而金鱼损失采用哈希控制的固定掩码模式,保证同一段落每次出现时被屏蔽的位置一致,从根本上阻断模型完整记忆的可能性。

接下来,我们看看金鱼损失的具体实现方式。

在标准的 next-token prediction 训练中,模型以真实下一个 token 为目标输出预测分布,并据此计算交叉熵损失。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

而在金鱼损失框架下,模型依然在前向传播中预测每个位置的下一个 token,但在反向传播阶段,会以一定概率将某些位置从损失计算中移除。

也就是说,某些真实的 token 不再作为监督信号参与训练。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

初期实验中,研究人员采用了简单的静态掩码策略,例如固定屏蔽每条序列中的第 4 个 token。

为进一步防止模型从其他文档中“间接”学习到被掩码的内容(比如相同段落出现在多个网页),团队还提出了局部化哈希掩码(localized hashed mask):只要前 h 个 token 相同,掩码模式就保持一致,确保可重复性。

实验设置与结果分析

为验证金鱼损失对记忆化的抑制效果,研究团队设置了两类实验场景:

一是极端记忆场景:对少量文本进行上百轮重复训练,强力诱导模型记忆;

二是常规训练场景:模拟真实环境下按批次训练的过程。

评估指标包括:

RougeL 分数:衡量生成文本与目标之间的最长公共子序列,1.0 表示完全复现。

精确匹配率(Exact Match):统计完全正确预测的序列占比。

实验发现,在极端条件下,标准训练使 LLaMA-2-7B 完整记住了 100 篇文章中的 84 篇,而使用金鱼损失的模型一篇都没记住。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

(注:实验中模型在《哈利·波特》第一章或 100 篇维基百科文章上持续训练了 100 个 epoch)

在常规训练场景下,金鱼损失也大幅降低了模型逐字复现训练数据的倾向。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

有人可能会担心:如果故意让模型“漏学”一些 token,会不会影响其整体能力?

研究结果表明:在多项基准测试中,金鱼损失模型、标准模型与对照组之间没有显著性能差异。

 大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背

值得注意的是,金鱼损失的关键在于跳过部分 token 的梯度更新。因此,模型需要更多数据来弥补信息空缺,可能导致训练效率略有下降。

参考链接

[ 1 ] https://www.php.cn/link/46a62c34c7b8b0c0d02f0833df49ec20

一键三连「点赞」「转发」「小心心」

欢迎在评论区分享你的看法!

— 完 —

专属 AI 产品从业者的实名社群,只聊 AI 产品最落地的真问题 扫码添加小助手,发送「姓名 + 公司 + 职位」申请入群~

进群后,你将直接获得:

最新最专业的 AI 产品信息及分析

不定期发放的热门产品内测码

内部专属内容与专业讨论

点亮星标

科技前沿进展每日见

以上就是大模型“记性差一点”反而更聪明!金鱼损失随机剔除 token,让 AI 不再死记硬背的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/38815.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月5日 17:01:58
下一篇 2025年11月5日 17:16:13

相关推荐

  • newt币是什么?投资价值怎么样

    newt币,全称为newton token,是牛顿项目(newton project)生态系统中的原生数字通证。它不仅仅是一种简单的加密货币,更是支撑整个项目运行、激励参与者和实现治理功能的核心工具。理解newt币,需要先了解其背后的牛顿项目。 探究NEWT币:一种去中心化生态系统中的数字代币 牛顿…

    2025年12月8日
    000
  • Payram:通过自托通道开创了稳定付款的未来

    payram让商家能够自主接受stablecoin支付。随着stablecoins在全球贸易中扮演越来越重要的角色,payram提供了一个可扩展且安全的解决方案。 Payram:通过自托管通道引领稳定支付新时代 在快速演进的数字金融领域,Payram正逐渐成长为一名重要力量,助力商家迎接支付未来。通…

    2025年12月8日
    000
  • 稳定币跟比特币有什么关联与区别

    稳定币跟比特币有什么关联与区别 稳定币与比特币同属于数字货币的范畴,都在区块链技术的基础上运行,但它们的设计初衷、价值来源和市场功用存在着本质的不同。简单来说,比特币是一种追求价值增长与去中心化自由的数字资产,而稳定币的核心目标是维持价值的稳定,充当数字世界中的“锚定货币”。 两者之间的深层联系 尽…

    2025年12月8日
    000
  • SEI Price Skyrockets:加密集会还是短暂的财富?

    在更广泛的加密货币市场回暖的推动下,sei价格正迎来一波强劲上涨。这是一次可持续的反弹,还是短暂的高峰?我们将深入探讨影响sei价格走势与市场预期的关键因素。 近期SEI价格快速攀升,引起了投资者的高度关注,许多人开始猜测这是否预示着更大的行情启动。为了厘清局势,我们来看看推动SEI价格上涨的背后力…

    2025年12月8日
    000
  • 分数NFT,AI驱动的数字所有权和NFT革命:数字资产的新时代

    探索nft的全新维度:分数化、ai驱动与数字所有权的未来。在这篇深入解析的文章中,了解nft领域正在发生的变革趋势和潜在发展方向。 NFT的世界正以前所未有的速度扩展,远远超出像素艺术的范畴。分数化NFT和人工智能技术正在重塑行业格局,使数字资产更具可访问性,并推动动态化、智能化的发展进程。 分数化…

    2025年12月8日
    000
  • 连锁链接,万事达卡和链接访问:将差距弥合到加密货币数十亿美元

    mastercard与chainlink携手合作,为30亿用户提供无缝接入加密货币的链上解决方案。这是否预示着数字支付新时代的到来? 这是什么大新闻?围绕“Chainlink、MasterCard和链上接入”的热议并非空穴来风。我们正在见证一个可能改变行业格局的合作,它有望将加密货币推向主流市场。 …

    2025年12月8日
    000
  • 脾气暴躁的AI章鱼和Web3对真正实用程序的追求:纽约人

    探索脾气暴躁的ai章鱼概念(例如paul grumpus,web3)与真实效用追求之间的交汇点,正在推动加密领域从炒作走向有形价值。 让我们面对现实吧,Web3世界看起来就像一个没有底线的马戏团。到处是喧嚣和口号,却缺乏实质内容。但现在情况似乎在转变,人们开始渴望真正有价值、可感知的东西。于是,脾气…

    2025年12月8日
    000
  • Insta360麦克风空气:无线音频进行袖珍升级

    insta360推出mic air进军无线麦克风市场,为内容创作者提供了一款体积小巧且价格亲民的解决方案,尤其适合已经使用insta360设备的用户。 Insta360 Mic Air正式加入无线麦克风行列,成为内容创作者的新选择。它体积小巧,功能强大,适用于Insta360运动相机。我们来详细了解…

    2025年12月8日
    000
  • pi pico w,一次性密码和令牌:安全组合

    探索如何利用pi pico w打造安全的一次性密码(otp)令牌,从而在传统密码基础上提升安全等级。 pi pico w、一次性密码与令牌:强强联合 随着网络攻击日益频繁,保障数字资产的安全变得愈发重要。一次性密码(OTP)作为一种比静态密码更安全的替代方案,能够有效防范重放攻击,提高身份验证的安全…

    2025年12月8日
    000
  • 航空信号,交易目标和市场新闻:鲸鱼活动激发乐观

    分析围绕机场金融(aero)的鲸鱼活动,技术指标和市场动态。 aero可以收回$ 1吗?现在找出! 航空信号,交易目标和市场新闻:鲸鱼活动激发乐观 机场金融(Aero)正在升温!最近出现的鲸鱼活动显示出战略性布局,而其与基础生态系统的紧密关联则进一步推动了市场情绪。Aero能否突破关键阻力位?让我们…

    2025年12月8日
    000
  • 2025年6月的加密山羊:与Qubetics及其他

    看看2025年6月的altcoin格局,重点关注码头($tics)及其他潜力项目,如avalanche、polkadot等。 加密世界正变得热闹非凡,如果您在2025年6月忽略了Altcoins,那将错过许多机会。这并非传统的投资组合,我们正深入探索数字边界,像码头这样的项目正在掀起波澜。抓紧时间,…

    2025年12月8日
    000
  • 模因硬币躁狂症:预售收益和25年观看的加密货币

    浏览2025年的模因币热潮,聚焦预售带来的丰厚收益,并特别关注troller cat、little pepe和bitcoin solaris等加密项目。 2025年的Meme币市场异常火爆,预售阶段展现出巨大的投资回报潜力。诸如Troller Cat、Little Pepe以及Bitcoin Sol…

    2025年12月8日
    000
  • FLOKI价格预测:技术逆转信号潜在收益?

    floki inu是否即将迎来突破?解析这一模因币的最新价格走势、技术指标与未来预期。 FLOKI价格展望:反转信号显现,潜在上涨可期? Floki Inu(FLOKI)近期出现异动!最新的价格表现暗示着可能的技术性反转,市场对其短期乃至中长期走势再度燃起关注。我们来深入剖析背后的因素以及未来可能的…

    2025年12月8日
    000
  • 拖钓猫:模因硬币在2025年扑灭了吗?

    忘记道路。 troller cat($ tcat)通过堆积,游戏燃烧和真正的实用程序将其拖到顶部。这是2025年的模因硬币吗? 模因硬币市场正处于狂热状态,但可以确定的是:它不会消失。别再执着于熟悉的生活;在2025年,模因硬币的目标是实现实际价值。像喜剧演员、测试项目以及一只调皮的猫科动物这样的名…

    2025年12月8日
    000
  • SynaptoGenix,Bittensor和Corporate国库:一个新时代?

    探索synaptogenix大胆地进入bittensor(tao)以及企业加密货币库的增长趋势,包括nano labs的$ 1b bnb收购计划。 SynaptoGenix、Bittensor与Corporate国库:一个新时代? 随着越来越多的企业将数字资产纳入其战略之中,金融界正热议不断。从比特…

    2025年12月8日
    000
  • 加密公牛跑步?今天要购买的顶级山寨币!

    加密牛市临近了吗?探索bnb、morpho与aero等主流山寨币,以及如litecoin和angry pepe fork等潜在宝藏,它们都具备增长潜力。现在入手正当时! 加密牛市即将启动?值得入手的主流山寨币清单! 随着降息预期升温及比特币呈现积极走势,加密市场的牛市是否正在酝酿?精明投资者已将目光…

    2025年12月8日
    000
  • 连锁链接(链接)令牌:在2026年解码其潜力价值

    探索chainlink在区块链中的角色、link代币的实用功能及其2026年价值的专家展望。 到2026年,您的LINK代币值多少钱?随着Chainlink在连接区块链与现实世界方面的重要性日益增强,了解LINK代币的潜在价值变得尤为关键。我们一起来看看影响其价格的专家预测和相关因素。 Chainl…

    2025年12月8日
    000
  • Celestia的Tia令牌在火中:内部人士倾销指控和创始人的回应

    celestia面临内部人士大量抛售tia代币的指控,该指控被认为影响了代币的价值。项目创始人mustafa al-bassam在社区信任动摇的情况下,为项目的财务状况和未来愿景进行了辩护。 TIA代币陷入风波:内部倾销指控与创始人的回应 模块化区块链网络Celestia正遭遇风波。关于内部人员倾销…

    2025年12月8日
    000
  • 万事达卡,USDG Stablecoin和网络效应:嗡嗡声是什么?

    万事达卡(mastercard)正在加大对加密货币领域的投入,积极支持usdg和pyusd等稳定币的发展。这一动向揭示了数字支付行业的新兴趋势,并预示着未来金融交易方式的深刻变革。 万事达卡在加密领域迈出了重要步伐,显著提升了对稳定币的支持力度。此举不仅顺应潮流,更是一次具有战略意义的布局,旨在引领…

    2025年12月8日
    000
  • 加密货币将于2025年6月进行爆炸性增长:您需要知道的

    获取在2025年6月有望实现爆发式增长的加密货币独家情报。 准备好迎接冲击吧,加密爱好者们!数字资产世界即将迎来一场猛烈的行情风暴。我们深入挖掘那些预计将在未来几个月内强势崛起的加密项目,带来您不可错过的趋势分析、深度见解以及可能改变格局的关键项目。 2025年6月加密市场:简要前瞻 加密市场如同一…

    2025年12月8日
    000

发表回复

登录后才能评论
关注微信