重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

众所周知,大型语言模型(LLM)可以通过上下文学习的方式从少量示例中学习,无需进行模型微调。目前,这种上下文学习现象只能在大型模型中观察到。例如,像GPT-4、Llama等大型模型在许多领域中都表现出了卓越的性能,但由于资源限制或实时性要求较高,许多场景无法使用大型模型

那么,常规大小的模型是否具备这种能力呢?为了探索小模型的上下文学习能力,字节和华东师大的研究团队在场景文本识别任务上进行了研究。

目前,在实际应用场景中,场景文本识别面临着多种挑战:不同的场景、文字排版、形变、光照变化、字迹模糊、字体多样性等,因此很难训练一个能应对所有场景的统一的文本识别模型。

解决该问题的一个直接方法是收集相应的数据,并在具体场景中微调模型。然而,这个过程需要重新训练模型,计算量很大,并且需要保存多个模型权重以适应不同的场景。如果文本识别模型能够具备上下文学习能力,在面对新场景时,只需要少量标注数据作为提示,就能提升在新场景上的性能,从而解决上述问题。然而,场景文本识别是一个资源敏感型任务,将大模型作为文本识别器会消耗大量资源。通过初步的实验观察,研究人员发现传统的大模型训练方法并不适用于场景文本识别任务

为了解决这个问题,来自字节跳动和华东师大的研究团队提出了自进化文本识别器,E2STR(Ego-Evolving Scene Text Recognizer)。这是一个融合了上下文学习能力的常规大小的文本识别器,能够快速适应不同的文本识别场景,而无需微调

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

论文链接:https://arxiv.org/pdf/2311.13120.pdf

Qoder Qoder

阿里巴巴推出的AI编程工具

Qoder 270 查看详情 Qoder

E2STR 配备了一种上下文训练和上下文推理模式,不仅在常规数据集上达到了 SOTA 的水平,而且可以使用单一模型提升在各个场景中的识别性能,实现对新场景的快速适应,甚至超过了经过微调后专用模型的识别性能。E2STR 证明,常规大小的模型足以在文本识别任务中实现有效的上下文学习能力。

方法

在图1中,展示了E2STR的训练和推理过程

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

1. 基础文本识别训练

基础文本识别训练阶段采用自回归框架训练视觉编码器和语言解码器,目的为了获取文本识别能力:

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

2. 上下文训练

上下文训练阶段 E2STR 将根据文中提出的上下文训练范式进行进一步训练。在这一阶段,E2STR 会学习理解不同样本之间的联系,从而从上下文提示中获取推理能力。

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

如图 2 所示,这篇文章提出 ST 策略,在场景文本数据中进行随机的分割和转换,从而生成一组 “子样本”。子样本在视觉和语言方面都是内在联系的。这些内在联系的样本被拼接成一个序列,模型从这些语义丰富的序列中学习上下文知识,从而获取上下文学习的能力。这一阶段同样采用自回归框架进行训练:

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

需要进行改写的内容是:3. 上下文推理改写后的内容:3. 根据上下文进行推理

针对一个测试样本,该框架会从上下文提示池中选择 N 个样本,这些样本在视觉隐空间与测试样本具有最高的相似度。具体来说,这篇文章通过对视觉 token 序列做平均池化,计算出图像 embedding I 。然后,从上下文池中选择图像嵌入与 I 的余弦相似度最高的前 N 个样本,从而形成上下文提示。

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

将上下文提示和测试样本拼接在一起送入模型后,E2STR会以无需训练的方式从上下文提示中学习新的知识,从而提高测试样本的识别准确率。需要注意的是,上下文提示池只保留视觉编码器输出的令牌,使得上下文提示的选择过程非常高效。此外,由于上下文提示池很小,并且E2STR无需训练即可进行推理,因此额外的计算开销也被降至最低

实验

实验主要从三个方面进行:分别是传统文本识别集、跨域场景识别和困难样本修正

1. 传统数据集

从训练集中随机抽取很少的样本(1000 个,训练集 0.025% 的样本数量)组成上下文提示池,在 12 个常见的场景文本识别测试集中进行的测试,结果如下:

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

可以发现 E2STR 在识别性能差不多已经饱和的传统数据集上依然有所提升,超越了 SOTA 模型的表现。

需要进行改写的内容是:2. 跨域场景

跨域场景下每个测试集仅提供 100 个域内训练样本,无训练和微调对比结果如下,E2STR 甚至超过了 SOTA 方法的微调结果。

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

需要进行改写的内容是:3. 修改困难样本

研究人员收集了一批困难样本,对这些样本提供了 10%~20% 的标注,对比 E2STR 的无需训练的上下文学习方法和 SOTA 方法的微调学习方法,结果如下:

重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力

相比微调方法,E2STR-ICL显著降低了困难样本的错误率

未来展望

E2STR 证明了使用合适的训练和推理策略,小模型也可以拥有和 LLM 类似的 In-context Learning 的能力。在一些实时性要求比较强的任务中,使用小模型也可以对新场景进行快速的适应。更重要的是,这种使用单一模型来实现对新场景快速适应的方法使得构建统一高效的小模型更近了一步。

以上就是重新表达的标题为:字节跳动与华东师大的合作:探索小模型的上下文学习能力的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/954423.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月1日 18:04:58
下一篇 2025年12月1日 18:05:20

相关推荐

  • css怎么设置文本的行距

    在css中,可以利用line-height属性来设置文本的行距,该属性的作用就是设置行间的距离、调节每行文字字体间距的,只需要给文本元素添加“line-height:间距值;”样式即可;需要注意,间距值不可为负值。 本教程操作环境:windows7系统、CSS3&&HTML5版、De…

    2025年12月24日
    000
  • css如何实现禁止选择文本

    css实现禁止选择文本的方法是,添加user-select属性,并且将属性值设置为none,表示文本不能被选取,具体代码如【user-select:none;】。 本文操作环境:windows10系统、css 3、thinkpad t480电脑。 在 web 浏览器中,如果我们在文本上双击,文本会被…

    2025年12月24日
    000
  • css怎么设置文本内容居中

    css设置文本内容居中的方法是,给文本元素添加text-align属性,并且将属性值设置为center即可,例如【h1 {text-align: center}】,表示把标题的水平对齐方式设置为居中。 本文操作环境:windows10系统、css 3、thinkpad t480电脑。 text-al…

    2025年12月24日
    000
  • css怎么设置文本居中对齐

    css设置文本居中对齐的方法:可以利用text-align属性来实现,如【p{text-align:center;}】。我们也可以设置文本居左或居右,如【text-align:left;】或【text-align:right;】。 本文操作环境:windows10系统、css 3、thinkpad …

    2025年12月24日
    000
  • css怎么隐藏文本超出部分

    css隐藏文本超出部分的方法:可以利用text-overflow属性来实现,如【text-overflow:ellipsis;】。属性值ellipsis表示用省略号来代表超出部分的文本。 属性介绍: text-overflow属性指定当文本溢出包含它的元素,应该发生什么。 (学习视频分享:css视频…

    2025年12月24日
    000
  • css怎么实现文本的垂直排列

    css实现文本的垂直排列的方法:可以利用writing-mode属性来实现,如【writing-mode: vertical-rl;】。writing-mode属性定义了文本在水平或垂直方向上如何排布。 本教程操作环境:windows10系统、css3,本文适用于所有品牌的电脑。 writing-m…

    2025年12月24日
    000
  • css实现禁止选中文本

    css代码: .box { /* 禁止选中文本 */ -moz-user-select: none; /*火狐*/ -webkit-user-select: none; /*webkit浏览器*/ -ms-user-select: none; /*IE10*/ -khtml-user-select:…

    2025年12月24日
    000
  • css实现文本图标对齐的方法

    开发中遇见图片跟文字放在一行显示是最常见不过的了,两个行内元素的对齐通常也是最令人头疼,有时候明明使用了最常用的对齐方法,却总还是有些许偏差,先来看一个最基本的示例: html部分: @@##@@ xx测试对齐Style- 推荐教程:CSS入门教程 css部分: .wrap { width: 300…

    2025年12月24日 好文分享
    000
  • css文本单行超出和多行超出省略号分别如何实现?

    有时候在设计网页的时候可能会遇到文本太长而导致页面不太美观,那么如何来解决这个问题呢?本篇文章将给大家来介绍关于css文本单行超出省略号以及多行文本超出省略号的实现方法。 首先我们来看一看css实现单行文本超出省略号的方法。 css实现单行文本的溢出显示省略号应该用text-overflow:ell…

    2025年12月24日
    000
  • CSS怎么设置垂直居中?

    在我们开发前端页面的时候,为了让页面效果美观,会出现需要垂直居中效果的地方。本章就让我们来了解一下用css如何设置垂直居中,详细介绍一下设置文字与div盒子的垂直居中的几种方法。有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 推荐手册:CSS在线手册 一:css如何设置文本文字垂直居…

    2025年12月24日 好文分享
    000
  • css渐变色彩 省略标记 嵌入字体 文本阴影的全面介绍

    下面为大家带来一篇css渐变色彩 省略标记 嵌入字体 文本阴影全面了解。内容挺不错的,现在就分享给大家,也给大家做个参考。 1、渐变色彩  CSS3 Gradient 分为线性渐变(linear)和径向渐变(radial)。由于不同的渲染引擎实现渐变的语法不同,这里我们只针对线性渐变的 W3C 标准…

    2025年12月24日 好文分享
    000
  • 关于css多行文本溢出时出现省略号的内容

    这篇文章主要介绍了css多行文本溢出时出现省略号的示例的相关资料,内容挺不错的,现在分享给大家,也给大家做个参考。 多行文本溢出时出现省略号 本文推荐2种方法。 1. css tip:只兼容chrome内核的浏览器。ff不支持。 立即学习“前端免费学习笔记(深入)”; .box { overflow…

    好文分享 2025年12月24日
    000
  • CSS3字体与文本效果的示例代码分享

    CSS3允许我们使用自定义字体  也多了一些不错的文本效果 自定义字体 使用自定义字体需要使用@font-face规则 当然首先你要有自定义文字文件 Payen S.Tsung @font-face { font-family: myDIYfont; /*自定义字体名*/ src: url(‘Gin…

    2025年12月23日 好文分享
    100
  • 我们如何在HTML中添加粗体文本?

    要显示粗体文本,请使用标签。HTML标签用于强调重要文本。 示例 您可以尝试运行以下代码来实现HTML中的标签− HTML strong Tag This is an important text 以上就是我们如何在HTML中添加粗体文本?的详细内容,更多请关注创想鸟其它相关文章!

    2025年12月21日
    000
  • 将文本包围起来,使用HTML使其闪烁

    使用 标签使文本闪烁。 HTML 标签用于封装文本以使其闪烁。 您可以尝试运行以下代码来实现 标签 –  注意 – 不要使用此元素,因为它已过时。 示例 HTML blink Tag This text will blink in Netscape Version 5.0 以…

    2025年12月21日
    000
  • 在HTML中创建强调文本

    要显示强文本,请使用 标签。 HTML 标签用于强调重要的文本。 示例 您可以尝试运行以下代码来在 HTML 中实现 标签 – HTML strong Tag This is an important text 以上就是在HTML中创建强调文本的详细内容,更多请关注创想鸟其它相关文章!

    2025年12月21日
    000
  • 我们如何在HTML中设置文本字体?

    标签用于设置 HTML 中的字体,但现已弃用。使用 CSS 达到同样的目的。 示例 您可以尝试运行以下代码来更改 HTML 中文本的字体 – Tutorialspoint Learning videos Learning content 以上就是我们如何在HTML中设置文本字体?的详细内…

    2025年12月21日
    000
  • html中如何实现文本与标签居中

    实现方法: (推荐教程:html教程) 1、文本居中: text-align: center;line-height: 100px; (=height) 2、标签居中 立即学习“前端免费学习笔记(深入)”; margin: 0 auto; 其中0指的是margin-top:0 具体代码: 搜索论坛 …

    2025年12月21日
    000
  • 关于HTML 文本格式化的代码

    下面为大家带来一篇html 文本格式化的简单实例。内容挺不错的,现在就分享给大家,也给大家做个参考。 一,文本格式化:此例演示如何在一个 HTML 文件中对文本进行格式化。 This text is boldThis text is strongThis text is bigThis text i…

    2025年12月21日
    000
  • HTML 文本格式化

    这篇文章主要介绍了关于HTML 文本格式化 ,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 html 文本格式化 自选教程(如约智惠.com)加粗文本斜体文本电脑自动输出这是下标 和 上标 实例 文本格式化 自选教程(如约智惠.com)这个文本是加粗的这个文本是加粗的这个文本字体放大…

    好文分享 2025年12月21日
    000

发表回复

登录后才能评论
关注微信