
本文深入探讨PyTorch Tensor的维度管理机制。我们将详细解析Tensor创建时size参数的解读方式,理解其从末尾到开头的维度定义规则。接着,阐述聚合操作(如torch.sum)中axis参数如何影响计算方向与输出维度。最后,通过torch.softmax等变换操作,展示dim参数如何指定函数作用的维度范围,帮助读者全面掌握PyTorch Tensor的维度处理。
pytorch中的tensor是处理数据的基础结构,其维度的正确理解和操作是高效开发的关键。本文将从tensor的创建、聚合到变换三个核心方面,详细解析pytorch如何处理维度。
1. Tensor的创建与size参数
在PyTorch中创建Tensor时,size参数是定义其形状的关键。这个参数通常接受一个整数元组,每个整数代表对应维度的大小。理解size参数的解读方式至关重要:PyTorch将size元组中的维度从最后一个元素到第一个元素进行解释。具体来说,元组的最后一个元素代表Tensor的列数,倒数第二个元素代表行数,以此类推。
示例代码:
import torch# 常见的Tensor创建方式# 可以省略括号,直接作为位置参数传入:t1 = torch.ones(2, 3) # 创建一个2行3列的矩阵print(f"torch.ones(2, 3) shape: {t1.shape}") # 输出: torch.Size([2, 3])# 当size参数需要作为元组传递时(例如,某些函数只接受一个size元组参数):t2 = torch.randint(10, (2, 3)) # 创建一个2行3列的随机整数矩阵print(f"torch.randint(10, (2, 3)) shape: {t2.shape}") # 输出: torch.Size([2, 3])
维度解读规则:
size=(…, m, n)n 代表最内层(通常是列)的数量。m 代表次内层(通常是行)的数量。… 依此类推,表示更高维度的数量。
不同size参数的Tensor形状示例:
(2,)长度为2的一维Tensor2–(2,)(2,1)2行1列的矩阵12-(2,1)(1,2)1行2列的矩阵21-(1,2)(3,2)3行2列的矩阵23-(3,2)(4,3,2)4个3行2列的矩阵234(4,3,2)
注意事项:
size=(2,) 创建的是一个一维Tensor,它只有一个维度。size=(2,1) 和 size=(1,2) 都是二维Tensor(矩阵),尽管它们在视觉上可能看起来像向量,但其内部结构和操作行为与一维Tensor不同。理解这一点对于避免维度错误至关重要。
2. Tensor的聚合与axis参数
许多PyTorch Tensor的方法,如torch.sum()、torch.mean()等,都需要一个axis(或dim)参数来指定操作沿着哪个维度进行。当指定axis时,操作将沿该维度进行,并通常会减少Tensor的维度。
torch.sum() 的行为解析:
以torch.sum(axis=axis)为例,其行为可以总结为两点:
沿指定维度求和: 操作会沿着axis参数所指定的维度对所有元素进行求和。维度缩减与重排: 被求和的维度将从Tensor的形状中移除,导致Tensor的维度减少。其余维度会相应地“移动”以填充被移除维度留下的空位。
axis=-1 的特殊意义:axis=-1 总是指代Tensor的最后一个维度(即最内层的维度,在二维矩阵中通常是列维度)。
对于一维Tensor (N,),sum(axis=-1) 将所有N个元素相加,结果是一个标量。对于二维Tensor (M, N),sum(axis=-1) 将对每一行中的所有N个列元素求和,生成一个长度为 M 的一维Tensor。对于更高维度的Tensor,sum(axis=-1) 会在最内层进行求和,并消除该维度。
示例:torch.sum() 操作
假设我们有一个由1组成的Tensor t = torch.ones(size):
(2,)-1或0[]tensor(2.)沿唯一维度求和,结果为标量。(2,1)-1或1[2]tensor([1., 1.])沿列(axis=1)求和,每行只有一个元素,结果保留行维度。(1,2)-1或1[1]tensor([2.])沿列(axis=1)求和,每行有2个元素,结果为单元素向量。(3,2)-1或1[3]tensor([2., 2., 2.])沿列(axis=1)求和,每行2个元素,结果为3个元素的向量。(4,3,2)-1或2[4,3]tensor([[2., 2., 2.],[2., 2., 2.],[2., 2., 2.],[2., 2., 2.]])沿最内层(axis=2)求和,每个子矩阵的2个元素相加,维度从(4,3,2)变为(4,3)。
关键点:
axis 参数可以是正数(从0开始索引)或负数(从-1开始索引,-1代表最后一个维度,-2代表倒数第二个维度,以此类推)。聚合操作通常会减少Tensor的维度。如果需要保留维度(例如,为了后续的广播操作),可以使用keepdim=True参数。
3. Tensor的变换与dim参数
Tensor变换操作,如torch.softmax()、torch.log_softmax()等,通常会改变Tensor的值,但保留其原始形状。在这些操作中,dim参数用于指定变换应该沿哪个维度进行
以上就是PyTorch Tensor维度操作详解:创建、聚合与变换的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1368614.html
微信扫一扫
支付宝扫一扫