Torchmeta：PyTorch的元学习库

程序猿 • 2025年11月6日 06:06:45 • 系统教程 • 阅读 0

作者 | sharmistha chatterjee

来源 | Medium

编辑 | 代码医生团队

介绍

元学习研究和开放源代码库提供了一种通过标准化基准和各种可用数据集对不同算法进行详细比较的方法，从而可以完全控制此评估的复杂性。但是，大多数在线可用的代码都有以下限制：

数据管道通常特定于一个数据集，而对另一个数据集进行测试需要大量的返工。元学习中的基准测试由数据集组成，这给数据管道增加了一层复杂性。因此大多数元学习项目都实现了适合其方法的自己的特定数据加载组件。输入级别缺乏标准会导致围绕每种元学习算法的机制产生差异，从而使比较过程更具挑战性。

为了解决这个限制，Google AI引入了Torchmeta，这是一个基于PyTorch深度学习框架构建的库，可以对多个数据集的元学习算法进行无缝且一致的评估。为了解释Torchmeta，使用了一些初步的概念，例如DataLoader和BatchLoader，可以解释为：

DataLoader是一种通用实用程序，可用作应用程序数据获取层的一部分，以通过批处理和缓存在各种远程数据源（例如数据库或Web服务）上提供简化且一致的API。

批处理是DataLoader的主要功能。批处理加载函数接受键列表，并返回一个Promise，该Promise解析为值列表DataLoader合并在单个执行框架内发生的所有单个加载（一旦解决了包装承诺，即执行），然后是具有全部功能的批处理函数要求的钥匙。

Torchmeta具有以下功能。Torchmeta通过少量的分类和回归为大多数标准基准提供了DataLoader，并提供了新的元数据集抽象。数据加载器与PyTorch的标准数据组件完全兼容，例如Dataset和DataLoader。Torchmeta为所有可用的基准提供了相同的界面，从而使不同数据集之间的转换尽可能无缝。Torchmeta还对PyTorch进行了一些扩展，以简化与元学习算法兼容的模型的开发，其中一些需要更高阶的区分。可用的基准有助于为开发新的元学习算法提供参考。Torchmeta提供了一个框架，研究人员可以围绕该框架构建自己的元学习算法，而不是使数据管道适应其方法。Torchmeta通过将元数据集与算法本身解耦来促进代码重用，从而提供了这一抽象层。

数次学习的数据加载器

快速学习很少能具有使用先验知识快速推广具有有限监督经验的新任务的能力。快速学习分为三类：

数据使用先验知识来增强监督经验。该模型通过先验知识约束假设空间，算法使用先验知识来更改对假设空间中最佳假设参数的搜索。

Torchmeta在其库中具有以下内容。

该库提供了与元学习文献中经典的几次快照分类和回归问题相对应的数据集。该界面旨在支持分类和回归的数据集之间的模块化，以简化对全套基准测试的评估过程。

为了平衡几次学习中固有的数据缺乏，元学习算法从称为元训练集的数据集D-meta = {D1，…，Dn}中获取一些先验知识。在几次学习中，每个元素Di仅包含几个输入/输出对（x，y），其中y取决于问题的性质。由于这些数据集可以包含过去执行的不同任务的示例。Torchmeta提供了一种解决方案，可以使用最少的问题特定组件来自动创建每个数据集Di。

极少回归

少有的回归问题中的大多数是通过不同功能的输入和输出之间的简单回归问题，其中每个功能对应一个任务。这些功能被参数化以允许任务之间的可变性，同时在各个任务之间保持不变的“主题”。例如，这些函数可以是形式为fi（x）= ai sin（x + bi）的正弦波，其中a和b在某些范围内变化。

在Torchmeta中，元训练集继承自名为MetaDataset的对象，每个数据集Di（i = 1，…，n，用户定义n）对应于该函数的特定参数选择，所有在元训练集创建时采样一次的参数。一旦知道了函数的参数，我们就可以通过在给定范围内对输入进行采样并将其提供给函数来创建数据集。

少拍分类

对于少有的分类问题，数据集Di的创建通常遵循两个步骤：

前N个类别是从大量候选项中取样的（对应于“ N向分类”中的N）。在下一步中，每个班级选择k个示例（对应于“ k-shot学习”中的k个）。这是一个分为两步的过程，它是作为继承自MetaDataset的CombinationMetaDataset对象的一部分而提供的，它为用户提供了针对特定问题的大量类候选者的用户规范。为了促进元学习的可重复性，每个任务都与一个唯一的标识符（类标识符的N元组）相关联。选择任务后，对象将返回数据集Di以及来自相应类集中的所有示例。Torchmeta还包括一些有用的功能，以增加诸如旋转图像之类的变体来增加班级候选人的数量。

下图展示了元学习器的作用，在元测试中，另一个不相交的任务集Tt〜p（T）（p（T）->任务T的分布）用于测试元学习者。每个Tt都作用于N个数据集，其中数据集= {D train Tt，D test Tt}。学习者从训练集D train Tt和测试集D test Tt上学习。Tt的平均损耗被视为元学习测试误差。

训练和测试数据集拆分

在元学习中，每个数据集Di分为两部分：训练集（或支持集），用于使模型适应当前的任务；测试集（或查询集），用于评估和元优化。当任务保持不变时，这两个部分不会重叠，在训练和测试集中都没有任何示例。Torchmeta在数据集上引入了一个称为Splitter的包装器，该包装器负责创建训练和测试数据集，以及可选地对数据进行混排。

为了实例化基于Mini Imagenet的5向1发分类问题的元训练集，使用：

数据集= torchmeta.datasets.MiniImagenet（“数据”，num_classes_per_task = 5，meta_train = True，下载= True）

数据集= torchmeta.transforms.ClassSplitter（数据集，num_train_per_class = 1，num_test_per_class = 15，shuffle = True）

除了元训练集之外，大多数基准测试还提供了元测试集，用于对元学习算法的总体评估（以及可能的元验证集）。创建MetaDataset对象时，可以使用meta_test = True（或meta_val = True）而不是meta_train = True来选择这些不同的元数据集。

元数据加载器

可以迭代一些镜头分类和回归问题中的元训练集对象，以生成PyTorch数据集对象，该对象包含在任何标准数据管道（与DataLoader组合）中。

元学习算法在批次任务上运行效果更好。与在PyTorch中将示例与DataLoader一起批处理的方式类似，Torchmeta公开了一个MetaDataLoader，该对象可以在迭代时产生大量任务。这样的元数据加载器能够输出一个大张量，其中包含批处理中来自不同任务的所有示例，如下所示：

数据集= torchmeta.datasets.helpers.miniimagenet（“数据”，镜头= 1，方式= 5，meta_train = True，下载= True）

数据加载器= torchmeta.utils.data.BatchMetaDataLoader（数据集，batch_size = 16）

元学习模块

下图显示了使用学习者的损失和错误信号进行元学习的顺序步骤。

元学习者的学习步骤：来源：

LuckyCola工具库

LuckyCola工具库是您工作学习的智能助手，提供一系列AI驱动的工具，旨在为您的生活带来便利与高效。

19 查看详情

https : //arxiv.org/pdf/1904.05046.pdf

在元学习中，PyTorch中的模型是由称为模块的基本组件创建的，该基本组件等效于神经网络中包含该层的计算图及其参数的一层。这些模块将其参数视为其计算图的组成部分，足以训练带有反向传播的模型。

但是，一些元学习算法需要通过参数更新（例如梯度更新）进行反向传播，以进行元优化（或“外环”），因此涉及高阶微分。

因此，适应PyTorch中的现有模块至关重要，以便它们可以处理任意计算图来替代这些参数。因此，Torchmeta扩展了现有模块，并保留了提供新参数作为附加输入的选项。这些新对象称为MetaModule，它们的默认行为（即，未指定任何其他参数）等同于它们的PyTorch对应对象。否则，如果指定了额外的参数（例如，梯度下降的一步的结果），则MetaModule会将它们视为计算图的一部分，并且反向传播将按预期进行。

上图描述了带有或不带有附加参数的线性模块（称为MetaLinear）的扩展如何工作，以及对梯度的影响。左图显示了元模块作为参数W和b的容器的实例，以及带有占位符的重量和偏差参数的计算图。中间的图显示了MetaLinear元模块的默认行为，其中的占位符用W＆b替换，这等效于PyTorch的Linear模块。右图显示了如何使用完整的计算图填充这些占位符，就像一个梯度下降步骤。在后一种情况下，外循环更新中必需的外循环相对于W的坡度可以正确地一直流到参数W。

下面的代码演示了如何从Torchmeta的现有数据集中生成训练，验证和测试元数据集。

代码语言：javascript代码运行次数：0运行复制

from torchmeta.datasets import Omniglot, MiniImagenet, CIFARFS, FC100, TieredImagenet, TCGAfrom torchmeta.transforms import Categorical, ClassSplitter, Rotationfrom torchvision.transforms import Compose, Resize, ToTensorfrom torchmeta.utils.data import BatchMetaDataLoader dataset = Omniglot("data",                   # Number of ways                   num_classes_per_task=5,                   # Resize the images to 28x28 and converts them to PyTorch tensors (from Torchvision)                   transform=Compose([Resize(28), ToTensor()]),                   # Transform the labels to integers (e.g. ("Glagolitic/character01", "Sanskrit/character14", ...) to (0, 1, ...))                   target_transform=Categorical(num_classes=5),                   # Creates new virtual classes with rotated versions of the images (from Santoro et al., 2016)                   class_augmentations=[Rotation([90, 180, 270])],                   meta_train=True,                   download=True)                   dataset = ClassSplitter(dataset, shuffle=True, num_train_per_class=5, num_test_per_class=15)dataloader = BatchMetaDataLoader(dataset, batch_size=16, num_workers=4)for batch in dataloader:    train_inputs, train_targets = batch["train"]    print('Train inputs shape: {0}'.format(train_inputs.shape))    # (16, 25, 1, 28, 28)    print('Train targets shape: {0}'.format(train_targets.shape))  # (16, 25)     test_inputs, test_targets = batch["test"]    print('Test inputs shape: {0}'.format(test_inputs.shape))      # (16, 75, 1, 28, 28)    print('Test targets shape: {0}'.format(test_targets.shape))    # (16, 75)

下图显示了下载后从Omnichlot和MiniImagenet从Torchmeta的数据集中生成的元学习数据集。

此处Omniglot数据集包含50个字母。将其分为30个字母的背景集和20个字母的评估集。在将背景大小调整为28x28张量后，应该使用背景集学习有关字符的一般知识（例如，特征学习，元学习）。此外，将标签传送到整数Glagolitic / character01”，“ Sanskrit / character14”，……）到（0，1，..，n）。

MiniImageNet包含60,000个84x84 RGB图像，每个类别600个图像。使用Torchmeta，可以生成HDF5格式的元学习数据集。

Torchmeta具有以HDF5格式下载数据集的功能，该功能允许：

要将包含HDF5文件的文件夹（包括子文件夹）用作数据源，在数据集中维护一个简单的HDF5组层次结构，启用延迟数据加载（即应DataLoader的请求），以便允许使用不适合内存的数据集，配备了数据缓存以加快数据加载过程，并且允许对源或目标数据集进行自定义转换。

用于定义Torchmeta数据集（例如Omniglot）的元学习参数的TieredImagenetClassDataset包含来自34个类别的图像。元训练/验证/测试拆分超过20/6/8个类别。每个类别包含10到30个类别。按类别划分（而不是按类别划分）可确保所有训练课程与测试课程完全不同（不同于Mini-Imagenet）。它带有以下一组参数，这些参数定义了训练，验证和测试数据集的划分以及应用于它们的转换和增强技术

num_classes_per_task（int）：每个任务的类数，对应于“ N向”分类中的“ N”。

meta_train：bool（`False`）：使用数据集的元火车拆分。如果设置为True，则必须将参数meta_val和meta_test设置为False。这三个参数中的一个必须正确设置为“ True”。

meta_val：bool（`False`）：使用数据集的元验证拆分。如果设置为True，则参数meta_train和metatest必须设置为False。这三个参数中只有一个必须设置为“ True”。

meta_test：bool（`False`）：使用数据集的元测试拆分。如果设置为True，则参数meta_train和meta_val必须设置为False。这三个参数中只有一个必须设置为“ True”。

meta_split：{'train'，'val'，'test'}中的字符串，可选要使用的拆分名称，如果所有三个都设置为False，则覆盖参数meta_train，metaval和metatest。

transform：可调用的，可选的：获取“ PIL”图像并返回转换后版本的函数/转换。

target_transform：可调用，可选：接受目标并返回转换版本的函数/转换。

dataset_transform：可调用，可选：函数/转换，它接受数据集（即任务），并返回其转换后的版本。-> torchmeta.transforms.ClassSplitter（）。

class_augmentations：可调用的，可选的列表：使用新类扩展数据集的函数列表。这些类是现有类的转换。

download：bool（默认值：False）如果为True，则下载pickle文件并处理根目录（位于tieredimagenet文件夹下）中的数据集。如果数据集已经可用，则不会再次下载/处理数据集。

结论

在此博客中，了解了Google AI最新发布的库Torchmeta，它提供了哪些功能以及可以解决什么样的元学习问题。可以浏览其他PyTorch元学习库，例如元Agonistic机器学习，以学习可以快速适应新任务的网络初始化。

https://github.com/dragen1860/MAML-Pytorch

如下图所示，在Torchmeta中很少有镜头学习可用于图像分类。

参考

https://github.com/markdtw/meta-learning-lstm-pytorch

https://arxiv.org/abs/1909.06576

https://docs.graphene-python.org/en/latest/execution/dataloader/

以上就是Torchmeta：PyTorch的元学习库的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/367585.html

ai git github go java javascript pdf python pytorch 深度学神经网络

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Win10专业版系统右键打不开显示设置和个性化怎么解决？

上一篇 2025年11月6日 06:06:27

win10音频服务未响应的解决教程

下一篇 2025年11月6日 06:07:25

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
5000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
2000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
1000
好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
0000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
0000
好文分享

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
0000
好文分享

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
0000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
2000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 好文分享
2000
好文分享

HTML、CSS 和 JavaScript 中的简单侧边栏菜单

构建一个简单的侧边栏菜单是一个很好的主意，它可以为您的网站添加有价值的功能和令人惊叹的外观。侧边栏菜单对于客户找到不同项目的方式很有用，而不会让他们觉得自己有太多选择，从而创造了简单性和秩序。今天，我将分享一个简单的 HTML、CSS 和 JavaScript 源代码来创建一个简单的侧边栏菜单。…

程序猿
2025年12月24日
2000

发表回复

登录后才能评论

Torchmeta：PyTorch的元学习库

关于作者

相关推荐

发表回复