PyTorch张量维度处理深度解析：从创建到聚合与转换

程序猿 • 2025年12月14日 08:55:58 • 用户投稿 • 阅读 0

本文深入探讨PyTorch张量在维度处理上的核心机制，涵盖张量创建时size参数的解读、聚合操作（如sum）中axis参数的行为，以及转换操作（如softmax）中dim参数的指定。通过详细示例和解释，旨在帮助开发者全面理解PyTorch张量的维度逻辑，从而更高效地进行张量操作。

在pytorch中，张量（tensor）是进行数值计算的基本数据结构。理解张量如何处理维度，是高效使用pytorch进行深度学习开发的关键。本文将从张量的创建、聚合和转换三个核心操作入手，详细解析pytorch张量中维度（dimension）和轴（axis/dim）参数的行为。

1. PyTorch张量的维度创建与理解

创建PyTorch张量时，size参数用于指定张量的形状。这个参数通常接受一个元组，其中的每个元素代表对应维度的长度。PyTorch对维度的解读有一个特定的顺序：size元组中的元素是从最内层（即列）到最外层依次指定的。

具体而言，如果size为(…, m, n)，则n表示最内层维度（通常可视为列数），m表示次内层维度（通常可视为行数），以此类推。

示例代码：

import torch# 创建一个2行3列的矩阵# size=(2,3) 表示2行（m=2），3列（n=3）tensor_2x3 = torch.ones((2, 3))print(f"torch.ones((2, 3)):n{tensor_2x3}nShape: {tensor_2x3.shape}n")# 也可以省略元组括号，但并非所有创建函数都支持tensor_abbreviated = torch.ones(2, 3)print(f"torch.ones(2, 3) (abbreviated):n{tensor_abbreviated}nShape: {tensor_abbreviated.shape}n")# 对于某些函数，如torch.randint，size参数必须是元组# torch.randint(high, size)tensor_randint = torch.randint(10, (2, 3))print(f"torch.randint(10, (2, 3)):n{tensor_randint}nShape: {tensor_randint.shape}n")

维度解读表格：

下表展示了不同size参数对应的张量形状及其维度含义：

size 参数描述列数（最内层）行数（次内层）更外层维度

(2,)长度为2的行向量；只有一个维度2–(2,1)2行1列的矩阵；具有两个维度12-(1,2)1行2列的矩阵；具有两个维度21-(3,2)3行2列的矩阵23-(4,3,2)4个3行2列的矩阵组成的3D张量234

从表中可以看出，size元组的最后一个元素总是对应张量的“列”维度，倒数第二个元素对应“行”维度，依此类推。理解这种“从后向前”的维度定义方式对于后续的聚合和转换操作至关重要。

2. 张量聚合操作中的维度处理

PyTorch张量中的许多聚合方法，如sum()、mean()、max()等，都接受一个axis或dim参数（通常是int或int列表）。这个参数指定了操作沿着哪个维度进行。当操作沿着某个维度进行时，该维度上的所有元素会被聚合，并且该维度通常会被缩减（移除）。

以torch.Tensor.sum()为例，其axis参数的行为如下：

示例：使用torch.ones创建张量并进行sum操作

import torch# 示例 1: 一维张量t1 = torch.ones(2) # tensor([1., 1.])print(f"Tensor: {t1}, Shape: {t1.shape}")sum_t1_axis0 = t1.sum(axis=0) # 或 axis=-1print(f"sum(axis=0): {sum_t1_axis0}, Output Shape: {sum_t1_axis0.shape}n")# 解释：沿着唯一的维度求和，结果是一个标量，维度被移除。# 示例 2: 2行1列矩阵t2 = torch.ones(2, 1) # tensor([[1.], [1.]])print(f"Tensor:n{t2}, Shape: {t2.shape}")sum_t2_axis1 = t2.sum(axis=1) # 或 axis=-1print(f"sum(axis=1): {sum_t2_axis1}, Output Shape: {sum_t2_axis1.shape}n")# 解释：沿着列（axis=1）求和，每行只有一个元素，结果是保留行维度的一维张量。# 示例 3: 1行2列矩阵t3 = torch.ones(1, 2) # tensor([[1., 1.]])print(f"Tensor:n{t3}, Shape: {t3.shape}")sum_t3_axis1 = t3.sum(axis=1) # 或 axis=-1print(f"sum(axis=1): {sum_t3_axis1}, Output Shape: {sum_t3_axis1.shape}n")# 解释：沿着列（axis=1）求和，结果是包含所有元素和的单元素一维张量。# 示例 4: 3行2列矩阵t4 = torch.ones(3, 2)print(f"Tensor:n{t4}, Shape: {t4.shape}")sum_t4_axis1 = t4.sum(axis=1) # 或 axis=-1print(f"sum(axis=1): {sum_t4_axis1}, Output Shape: {sum_t4_axis1.shape}n")# 解释：沿着列（axis=1）求和，对每一行进行求和，结果是一个包含3个元素的行向量。# 示例 5: 4x3x2 的3D张量t5 = torch.ones(4, 3, 2)print(f"Tensor:n{t5}, Shape: {t5.shape}")sum_t5_axis2 = t5.sum(axis=2) # 或 axis=-1print(f"sum(axis=2):n{sum_t5_axis2}, Output Shape: {sum_t5_axis2.shape}n")# 解释：沿着最内层维度（axis=2，即列）求和，每个2元素的子向量和为2，结果是4x3的矩阵。

axis=-1的特殊行为：

当axis=-1（或指定最末尾的维度索引）时，torch.sum()通常会执行以下两个主要操作：

沿着最内层维度（列维度）求和： 它会对张量中的每个“行”向量（或更高维张量中的最内层子张量）的所有元素进行求和。例如，对于一个2D矩阵，它会沿着每一行中的列方向求和。缩减维度并“移动”轴： 被求和的维度会被移除。例如，如果对一个(A, B, C)形状的张量沿着C维度（即axis=2或axis=-1）求和，结果的形状将是(A, B)。原先的B维度会占据C维度的位置，A维度会占据B维度的位置。这种行为有时会让人感到困惑，但这是因为PyTorch在显示张量时，最末尾的维度总是被视为列。

3. 张量转换操作中的维度指定

张量转换操作，例如torch.softmax()，会改变张量的值，但通常会保留其原始形状。dim参数在此类操作中指定了转换发生的维度。例如，softmax函数会将指定维度上的元素进行归一化，使得该维度上所有元素的和为1。

示例：torch.softmax()的使用

import torch# 创建一个随机的2x2x2的3D张量random_tensor = torch.randn((2, 2, 2))print(f"Original Tensor:n{random_tensor}nShape: {random_tensor.shape}n")# 沿着 dim=-1 (最内层维度，即列) 进行 softmax# 结果中，每个最内层子向量（即每“行”的“列”）的和为1softmax_dim_neg1 = random_tensor.softmax(dim=-1)print(f"Softmax (dim=-1):n{softmax_dim_neg1}nShape: {softmax_dim_neg1.shape}")# 验证：检查每个最内层子向量的和是否接近1print(f"Sums along dim=-1:n{softmax_dim_neg1.sum(dim=-1)}n")# 沿着 dim=-2 (次内层维度，即行) 进行 softmax# 结果中，每个“列”中的“行”的和为1softmax_dim_neg2 = random_tensor.softmax(dim=-2)print(f"Softmax (dim=-2):n{softmax_dim_neg2}nShape: {softmax_dim_neg2.shape}")# 验证：检查每个次内层子向量的和是否接近1print(f"Sums along dim=-2:n{softmax_dim_neg2.sum(dim=-2)}n")

结果解读：

当dim=-1时，softmax操作是沿着最内层维度进行的。这意味着对于张量中的每一个[…, i, :]切片，其所有元素的和将被归一化为1。在上面的示例中，[[0.7512, 0.2488]]中0.7512 + 0.2488约等于1，[[0.1585, 0.8415]]中0.1585 + 0.8415约等于1，以此类推。当dim=-2时，softmax操作是沿着次内层维度进行的。这意味着对于张量中的每一个[…, :, j]切片，其所有元素的和将被归一化为1。在上面的示例中，[[0.8773], [0.1227]]中0.8773 + 0.1227约等于1，[[0.3083], [0.6917]]中0.3083 + 0.6917约等于1，以此类推。

通过指定不同的dim，我们可以控制softmax（或其他转换函数）在哪个维度上进行归一化或转换，这对于构建神经网络层（如多头注意力机制中的注意力权重）至关重要。

注意事项与总结

负数索引： 在PyTorch中，维度索引可以使用负数，其中-1代表最末尾的维度，-2代表倒数第二个维度，以此类推。这在处理高维张量时非常方便，因为它不受张量实际维度数量的影响。维度顺序： 始终记住size参数的维度顺序是从最内层到最外层。聚合与转换的区别： 聚合操作（如sum）通常会减少张量的维度，而转换操作（如softmax）则保持张量形状不变。axis与dim： 虽然在不同函数中参数名可能不同（axis或dim），但它们的功能是相同的，都用于指定操作所作用的维度。

理解PyTorch张量如何处理维度是掌握其强大功能的基础。通过本文的详细解释和示例，希望读者能够对张量的创建、聚合和转换过程中的维度逻辑有更清晰、更深入的理解，从而在实际开发中更加游刃有余。

以上就是PyTorch张量维度处理深度解析：从创建到聚合与转换的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1368608.html

区别

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

解决LlamaIndex导入错误：一步步指南

上一篇 2025年12月14日 08:55:48

PyTorch Tensor维度操作深度解析：从创建到聚合与转换

下一篇 2025年12月14日 08:56:04

用户投稿

composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

require用于声明项目运行必需的依赖，如框架、数据库组件和第三方SDK，这些包会随项目部署到生产环境；2. require-dev用于声明仅在开发和测试阶段需要的工具，如PHPUnit、PHPStan、Faker等，不会默认部署到生产环境；3. 安装时composer install根据环境决定…

程序猿
2026年5月10日
10000
用户投稿

php常量怎么用_PHP常量（define/const）定义与使用方法

PHP中可通过define函数和const关键字定义常量，用于存储不可变值。define适用于全局作用域，支持动态名称和条件定义，如define(‘SITE_NAME’, ‘MyWebsite’)；const在编译时生效，语法简洁但限制多，只能在类或全…

程序猿
2026年5月10日
0000
用户投稿

Go语言接口与切片：如何识别和操作[]interface{}

本文将深入探讨Go语言中如何识别和操作`[]interface{}`类型的切片。我们将介绍类型断言（Type Assertion）的关键作用，并通过`switch`语句演示如何安全地检测`[]interface{}`类型，并进而遍历其内部元素。文章旨在提供清晰的示例代码和专业指导，帮助开发者有效地处…

程序猿
2026年5月10日
0000
用户投稿

c++中头文件和源文件的区别_c++头文件与源文件作用对比

头文件声明接口，源文件实现逻辑。头文件含类、函数声明及宏定义，通过#include被多文件共享，用include守卫防重；源文件实现具体功能，编译为目标文件后由链接器合并。声明与实现分离提升模块化与编译效率，模板和内联函数因需编译时可见故常置于头文件，命名空间避免符号冲突，整体结构使项目更清晰易维护…

程序猿
2026年5月10日
0000
用户投稿

Go语言中复制数组的几种方法详解

本文介绍了在 Go 语言中复制数组和切片的几种方法，重点讲解了内置的 `copy` 函数的使用方式，以及在多维切片场景下深拷贝与浅拷贝的区别，并提供了相应的代码示例。通过本文，你将掌握在不同场景下选择合适的复制方法，避免潜在的陷阱。在 Go 语言中，复制数组和切片是一个常见的操作。根据不同的需求，…

程序猿
2026年5月10日
0000
用户投稿

解决PHP foreach循环中变量“继承”问题：理解与避免意外数据泄露

本文探讨PHP foreach循环中一个常见的陷阱：当循环内部的数组或变量未被显式初始化时，其值可能会“继承”自上一次循环迭代，导致意外的数据泄露和逻辑错误。文章将深入分析这一现象的根源，并通过示例代码展示如何通过在每次迭代开始时正确初始化变量来解决此问题，确保代码行为的预期一致性。引言：fore…

程序猿
2026年5月10日
1000
用户投稿

Pandas：基于条件和 Groupby 替换列中的特定字符

本文介绍了如何使用 Pandas 库，结合 groupby 函数和字符串操作，根据特定条件替换 DataFrame 列中的字符。通过累积计数和字典映射，能够灵活地修改列中的特定部分，并根据替换值调整相关文本，实现数据清洗和转换的目的。在数据分析和处理中，经常需要根据特定条件修改 DataFrame…

程序猿
2026年5月10日
0000
用户投稿

Go语言中sync.WaitGroup的深度解析与实践

sync.WaitGroup是Go语言中用于并发编程的重要同步原语，它允许主协程等待一组子协程执行完毕。本文将深入探讨WaitGroup的工作原理、典型使用模式及其与sync.Mutex等其他同步机制的区别，并通过实际代码示例，帮助读者掌握其在并发控制中的应用，避免常见的误区，确保并发程序的正确性和…

程序猿
2026年5月10日
0000
用户投稿

HTML文档脚本怎么加载_HTML加载JavaScript教程

脚本应优先通过defer或async异步加载以避免阻塞渲染；将脚本放在body底部可防阻塞，但推荐使用defer确保DOM解析完成后再执行；async适用于独立脚本，defer用于依赖DOM或需顺序执行的脚本；优化方式包括代码分割、懒加载、CDN加速和浏览器缓存；加载失败时应重试、降级处理并监控错误…

程序猿
2026年5月10日
0000
用户投稿

Python怎么实现一个上下文管理器_Python上下文管理器协议实现

自定义Python上下文管理器需实现__enter__和__exit__方法，前者在进入with块时获取资源并返回对象，后者在退出时释放资源并可处理异常；通过类或contextlib.contextmanager装饰生成器函数均可创建；文件操作中with open()自动关闭文件是典型应用；__ex…

程序猿
2026年5月10日
0000
用户投稿

JavaScript解释器_javascript代码执行

JavaScript通过引擎解析执行，先语法分析生成AST，再编译为字节码或机器码，最后执行；执行时创建上下文并入栈，同步代码直接运行，异步任务由API处理后回调入队，事件循环在调用栈空时将回调推入执行；此机制解释了变量提升、暂时性死区及宏任务与微任务执行顺序差异。 JavaScript代码的执行依…

程序猿
2026年5月10日
0000
CSS的display属性有哪些值？inline和block有什么区别？

css的display属性通过定义元素的显示方式来控制网页布局。1.block元素独占一行，可设置宽高，默认如div、p等；2.inline元素不独占行，宽高由内容决定，如span、a；3.inline-block兼具block和inline特性，可并排显示且能设尺寸；4.none隐藏元素且不占空间…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

C++怎么使用静态库和动态库_C++链接静态库与动态库的方法与区别

静态库在编译时链接，生成独立可执行文件；动态库运行时加载，节省内存。1. 静态库用ar打包.o文件为.a，编译时通过-L和-l链接；2. 动态库需-fPIC编译生成.so，运行前配置LD_LIBRARY_PATH或系统路径；3. 静态库体积大但部署方便，动态库共享内存利于更新。在C++项目开发中，…

程序猿
2026年5月10日
0000
用户投稿

HTML Class属性详解：多类名与命名规范

HTML中的class属性用于为元素应用样式和行为。理解不同类型的类名定义方式至关重要，特别是单类名（如class=”name”或class=”name-new”）和多类名（如class=”name new”）之间的区别。核心在…

程序猿
2026年5月10日
1000
用户投稿

c++中&的作用引用与取地址运算符区别解析

在c++++中，&amp;amp;amp;符号既可以作为引用运算符，也可以作为取地址运算符。1) 作为引用运算符时，&amp;amp;amp;用于创建变量的别名，常用于函数参数和返回值，提高效率。2) 作为取地址运算符时，&amp;amp;amp;返回…

程序猿
2026年5月10日
1000
用户投稿

HTML代码怎么实现响应式布局_HTML代码响应式布局原理与媒体查询应用

响应式布局的核心原理是“一次开发，多端适应”，其本质在于通过弹性网格、流式图片和CSS媒体查询等技术，使网页能根据设备屏幕尺寸、分辨率等特性动态调整布局与内容呈现。与传统固定宽度布局不同，响应式设计采用相对单位（如%、rem、vw）、灵活的图片处理及媒体查询，实现移动端优先、自适应多设备的连续体验。…

程序猿
2026年5月10日
0000
用户投稿

为什么 TypeScript 比 JavaScript 更好

javascript 长期以来一直是 web 开发的基石，支持从小型脚本到大型应用程序的各种项目。然而，随着项目规模的扩大，javascript 的动态类型和缺乏结构性可能会成为开发的瓶颈。typescript 应运而生，它凭借静态类型检查和强大的工具集，迅速成为许多开发者构建可靠、可扩展应用程序的…

程序猿
2026年5月10日
1000
HTML如何制作网格布局？grid和flexbox的区别？

要制作真正的网格布局应首选css grid，因为它是专为二维布局设计的工具，能同时控制行和列；而flexbox适用于一维线性布局，适合沿单一轴线排列内容。1. 使用css grid时，先设置容器的display: grid，再通过grid-template-columns和grid-template…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

JavaScript模块化是什么_ES6模块和CommonJS有什么区别呢

JavaScript模块化将代码拆分为独立可复用单元，ES6模块（import/export，编译时加载、实时引用）与CommonJS（require/module.exports，运行时加载、值拷贝）核心区别在于设计目标和运行机制不同。 JavaScript模块化是把代码按功能拆分成独立、可复用的…

程序猿
2026年5月10日
0000
用户投稿

C++STL算法merge和inplace_merge使用技巧

merge用于合并两个有序区间到新空间，inplace_merge则原地合并同一容器内两个连续有序段；前者需额外存储空间，后者在原容器操作，适用于归并排序的合并阶段，二者均要求输入有序，时间复杂度为O(N+M)，合理使用可提升效率。在C++标准模板库（STL）中，merge 和 inplace_m…

程序猿
2026年5月10日
0000