深入理解 NumPy einsum:多张量求和与索引机制详解

深入理解 NumPy einsum:多张量求和与索引机制详解

本文详细解析 numpy `einsum` 在处理多张量求和时的内部机制。通过逐步分解求和过程和提供等效的显式循环实现,帮助读者理解 `einsum` 如何根据索引字符串高效地执行元素乘法、重排和特定维度上的求和操作,从而掌握其在复杂张量运算中的应用细节。

NumPy 的 einsum 函数提供了一种极其灵活且高效的方式来执行张量运算,包括点积、转置、求和、矩阵乘法等。其核心在于通过一个简洁的字符串表达式来定义输入张量的索引关系以及输出张量的索引顺序。然而,当涉及到多个张量的复杂求和(收缩)操作时,理解其内部元素的组合和求和过程可能会变得有些抽象。本文将深入探讨 np.einsum(‘ijk,jil->kl’, a, b) 这一特定操作的细节,帮助读者透彻理解其背后的机制。

einsum 索引符号解析

首先,我们来解析 np.einsum(‘ijk,jil->kl’, a, b) 中的索引字符串:

ijk: 表示第一个输入张量 a 的维度索引。a 是一个三维张量,其维度顺序为 i、j、k。jil: 表示第二个输入张量 b 的维度索引。b 也是一个三维张量,其维度顺序为 j、i、l。->kl: 表示输出张量的维度索引。输出将是一个二维张量,其维度顺序为 k、l。

理解操作规则:

元素乘法: einsum 会对所有具有相同索引的维度进行“匹配”。例如,a 的第一个维度是 i,b 的第二个维度也是 i;a 的第二个维度是 j,b 的第一个维度也是 j。这意味着在执行元素乘法时,a[i, j, k] 将与 b[j, i, l] 进行匹配并相乘。求和(收缩): 任何出现在输入索引字符串中但未出现在输出索引字符串中的索引,都将被求和(收缩)。在本例中,i 和 j 出现在输入 ijk 和 jil 中,但未出现在输出 kl 中,因此 i 和 j 这两个维度将被求和。输出维度: 出现在输出索引字符串 kl 中的索引 k 和 l 将构成输出张量的维度。

简而言之,np.einsum(‘ijk,jil->kl’, a, b) 的数学表达式等价于:$$ text{output}_{kl} = sum_i sumj text{a}{ijk} cdot text{b}_{jil} $$

案例分析:逐步分解求和过程

为了更直观地理解 einsum 的求和细节,我们可以通过一个技巧来逐步分解它。这个技巧是先执行所有元素的乘法而不进行任何求和,然后手动执行求和步骤。

假设我们有以下两个 NumPy 张量:

import numpy as npa = np.arange(8.).reshape(4, 2, 1)b = np.arange(16.).reshape(2, 4, 2)print("张量 a 的形状:", a.shape) # (4, 2, 1)print("张量 b 的形状:", b.shape) # (2, 4, 2)

步骤一:生成所有未求和的乘积

我们可以通过在输出索引中包含所有输入索引来阻止 einsum 进行求和。对于 ijk,jil->kl,如果我们将输出定义为 ijkl,则 einsum 将返回所有 a[i,j,k] * b[j,i,l] 的乘积,但不会进行任何求和。

# 生成所有元素的乘积,不进行求和intermediate_products = np.einsum('ijk,jil->ijkl', a, b)print("n所有未求和的乘积 (形状: i, j, k, l):")print(intermediate_products)print("形状:", intermediate_products.shape) # (4, 2, 1, 2)

在这个 intermediate_products 张量中,每个元素 [i, j, k, l] 都对应着 a[i, j, k] * b[j, i, l] 的乘积。例如,intermediate_products[0, 0, 0, 0] 对应 a[0, 0, 0] * b[0, 0, 0]。

步骤二:逐步执行求和

现在,我们知道 i 和 j 是需要被求和的维度。在 intermediate_products 张量中,i 对应轴 0,j 对应轴 1。我们可以逐个对这些轴进行求和。

首先,对 j 轴(轴 1)进行求和:

# 对 j 轴 (轴 1) 进行求和sum_over_j = intermediate_products.sum(axis=1)print("n对 j 轴求和后的结果 (形状: i, k, l):")print(sum_over_j)print("形状:", sum_over_j.shape) # (4, 1, 2)

接下来,对 i 轴(轴 0)进行求和:

# 对 i 轴 (轴 0) 进行求和final_result = sum_over_j.sum(axis=0)print("n对 i 轴求和后的最终结果 (形状: k, l):")print(final_result)print("形状:", final_result.shape) # (1, 2)

为了验证,我们可以直接运行原始的 einsum 操作:

original_einsum_result = np.einsum('ijk,jil->kl', a, b)print("n原始 einsum 结果 (形状: k, l):")print(original_einsum_result)print("形状:", original_einsum_result.shape) # (1, 2)# 验证结果是否一致print("n逐步求和结果与原始 einsum 结果是否一致:", np.allclose(final_result, original_einsum_result))

通过这种逐步分解的方式,我们清晰地看到了 einsum 如何先进行元素乘法,然后对指定维度进行求和,最终得到结果。

案例分析:显式循环实现

另一种理解 einsum 细节的方式是将其转换为等效的显式循环。这有助于我们从最基本的元素层面观察操作。

def sum_array_explicit_loop(A, B):    # 获取张量 A 的形状 (i_len, j_len, k_len)    i_len_a, j_len_a, k_len_a = A.shape    # 获取张量 B 的形状,这里我们只关心与输出相关的维度 (j_len, i_len, l_len)    # 实际上,B 的形状是 (j_len_b, i_len_b, l_len_b)    # 为了匹配 einsum 的索引,B 的实际形状是 (j_len_from_B, i_len_from_B, l_len_from_B)    # 我们需要确保 A 和 B 的匹配维度长度一致    j_len_b, i_len_b, l_len_b = B.shape    # 检查维度兼容性(einsum 会自动处理)    if not (j_len_a == j_len_b and i_len_a == i_len_b):        raise ValueError("张量维度不兼容")    # 初始化结果张量,其形状为 (k_len, l_len)    ret = np.zeros((k_len_a, l_len_b))    # 遍历所有可能的 i, j, k, l 组合    # i 和 j 是将被求和的维度    # k 和 l 是输出张量的维度    for i in range(i_len_a): # 遍历 A 的第一个维度 (i)        for j in range(j_len_a): # 遍历 A 的第二个维度 (j)            for k in range(k_len_a): # 遍历 A 的第三个维度 (k)                for l in range(l_len_b): # 遍历 B 的第三个维度 (l)                    # 执行元素乘法并累加到 ret[k, l]                    # 注意 B 的索引是 j, i, l,与 einsum 字符串 'jil' 对应                    ret[k, l] += A[i, j, k] * B[j, i, l]    return ret# 使用显式循环计算结果explicit_loop_result = sum_array_explicit_loop(a, b)print("n显式循环计算结果:")print(explicit_loop_result)# 验证结果是否与原始 einsum 一致print("显式循环结果与原始 einsum 结果是否一致:", np.allclose(explicit_loop_result, original_einsum_result))

通过这个显式循环,我们可以清晰地看到:

外层循环 for i in range(i_len_a) 和 for j in range(j_len_a) 对应了 i 和 j 这两个被求和的维度。内层循环 for k in range(k_len_a) 和 for l in range(l_len_b) 对应了输出张量的维度。核心操作 ret[k, l] += A[i, j, k] * B[j, i, l] 直接反映了 einsum 字符串 ijk,jil->kl 的含义:A 以 i,j,k 索引,B 以 j,i,l 索引,它们的乘积被累加到以 k,l 索引的结果张量中。当 i 和 j 的循环完成时,所有对应的乘积都已被累加到 ret[k, l] 中,从而实现了对 i 和 j 的求和。

总结与注意事项

einsum 的强大与简洁: einsum 通过其索引字符串提供了一种声明式的方式来描述复杂的张量操作,极大地简化了代码并提高了可读性。性能优势: 尽管显式循环有助于理解,但在实际应用中,NumPy 的 einsum 函数通常会利用底层的 C/Fortran 优化,比纯 Python 循环快得多。索引是核心: 理解 einsum 的关键在于掌握其索引规则:重复索引: 在输入字符串中重复但不在输出字符串中的索引表示求和(收缩)维度。非重复索引: 在输入字符串中不重复或在输出字符串中出现的索引表示输出维度。顺序: 输出字符串中索引的顺序决定了输出张量的维度顺序。多功能性: einsum 不仅可以处理复杂的求和,还可以用于实现转置 (‘ij->ji’)、点积 (‘i,i->’)、矩阵乘法 (‘ij,jk->ik’)、元素乘法 (‘ij,ij->ij’) 等多种张量操作。

通过本文的详细解析,相信读者对 np.einsum 在处理多张量求和时的内部工作机制有了更深入的理解。掌握 einsum 将使您能够更高效、更灵活地处理各种张量计算任务。

以上就是深入理解 NumPy einsum:多张量求和与索引机制详解的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1378118.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 18:35:21
下一篇 2025年12月14日 18:35:37

相关推荐

  • 输出格式要求:标题:Go 模板中安全地允许特定 HTML 标签

    第一段引用上面的摘要: 在 go 的 html/template 包中,处理来自不可信来源的 html 内容时,直接使用 html 类型可能会引入安全风险。本文介绍了一种通过解析 html 并仅保留特定允许的标签,从而安全地在 go 模板中渲染部分 html 内容的方法。该方法利用第三方库,例如 g…

    2025年12月15日
    000
  • 如何在Go中创建守护进程

    本文介绍了如何在Go语言中创建一个守护进程,使其在后台运行并与启动终端分离。我们将探讨使用 os.StartProcess 函数创建子进程,并解决与终端关联以及 Windows 平台上的相关问题,最终提供一种在Go中创建守护进程的有效方法。 在Go语言中,创建守护进程意味着启动一个在后台运行且与启动…

    2025年12月15日
    000
  • 初始化切片类型失败的原因及正确方法

    Go语言中,切片是一种非常强大的数据结构,但对其初始化方式的理解不当可能导致一些问题。本文将深入探讨切片类型初始化失败的常见原因,并提供正确的初始化方法,同时介绍一种更符合Go语言习惯的初始化方式。 我们先回顾一下文章摘要: 本文旨在解决Go语言中自定义切片类型初始化失败的问题。通过分析错误示例,解…

    2025年12月15日
    000
  • 使用方法初始化切片类型失败

    本文旨在解决使用方法初始化切片类型时遇到的问题。通过分析常见错误原因,提供正确的初始化方法,并对比推荐使用返回新切片的函数,帮助开发者理解切片的工作原理,编写更清晰、高效的 Go 代码。 在 go 语言中,切片是一种非常强大且常用的数据结构。然而,在使用方法来初始化切片类型时,开发者有时会遇到一些困…

    2025年12月15日
    000
  • Go语言中自定义切片类型初始化方法的正确实践:指针接收器与构造函数模式

    本教程深入探讨Go语言中自定义切片类型(如[][]float64)初始化方法的常见陷阱与解决方案。当使用指针接收器初始化切片时,直接对局部变量执行make操作不会更新原始切片。文章将详细阐述如何通过显式解引用赋值来修正此问题,并介绍Go语言中更常用且符合习惯的“构造函数”模式,即通过返回新切片实例的…

    2025年12月15日
    000
  • 使用方法绑定初始化切片类型时失败

    本文旨在解决在使用方法绑定初始化自定义切片类型时遇到的问题。通过分析示例代码,解释了切片初始化的常见错误,并提供了正确的初始化方法,以及更符合Go语言习惯的工厂函数方法。帮助读者理解切片的工作原理,并掌握初始化切片类型的正确姿势。 在使用go语言进行开发时,经常会遇到需要初始化自定义切片类型的情况。…

    2025年12月15日
    000
  • 正确初始化切片类型:深入理解切片和方法接收器

    本文旨在帮助开发者理解如何在Go语言中正确初始化自定义切片类型。通过分析常见的错误初始化方法,并提供正确的代码示例,详细解释了切片的底层机制以及方法接收器的作用。同时,探讨了返回新切片的惯用方法,并对比了不同初始化方式的优劣,帮助读者选择最适合自己的方案。 在Go语言中,切片是一种灵活且强大的数据结…

    2025年12月15日
    000
  • 使用 LiteIDE 构建 Go 项目的完整指南

    本文旨在帮助 Go 语言初学者快速上手 LiteIDE,解决在创建和运行 Go 项目时可能遇到的问题。通过本文,你将学会如何配置 LiteIDE,创建 Go 项目,设置 GOPATH,并成功运行你的第一个 Go 程序。 创建和配置 Go 项目 LiteIDE 是一款轻量级的 Go 语言集成开发环境,…

    2025年12月15日
    000
  • LiteIDE Go项目运行配置与常见错误解决指南

    本文旨在解决LiteIDE用户在运行Go项目时遇到的“process failed to start”错误。核心在于指导用户正确创建Go项目、将其导入LiteIDE,并为项目配置定制化的GOPATH,最后激活项目,确保LiteIDE能够准确识别并执行Go程序,从而实现项目的顺利编译与运行。 Lite…

    2025年12月15日
    000
  • LiteIDE Go 项目配置与运行故障排除指南

    本教程旨在解决使用 LiteIDE 开发 Go 项目时常见的“process failed to start”错误。文章将详细指导用户如何正确创建和导入 Go 项目,并通过设置自定义 GOOPATH 和激活项目来确保 LiteIDE 能够识别并成功运行 Go 应用程序,从而优化开发环境配置。 引言:…

    2025年12月15日
    000
  • LiteIDE Go项目运行配置指南:解决“进程启动失败”问题

    本教程旨在解决LiteIDE中Go项目运行时遇到的“进程启动失败”错误。我们将详细指导用户如何创建Go项目、正确导入到LiteIDE,并配置自定义GOOPATH,确保项目能够顺利编译和运行,从而优化开发体验。 理解“进程启动失败”错误 在使用liteide开发go项目时,部分用户可能会遇到“进程启动…

    2025年12月15日
    000
  • Golang程序中main包和main函数的特殊作用是什么

    main包和main函数共同构成Go可执行程序的基础:main包指示编译器生成可执行文件,main函数作为程序入口点,其签名必须为func main(),两者缺一不可。 在Go语言程序中,main包和main函数具有特殊的编译和执行意义,它们是构建可执行程序的基础。 main包的作用 Go语言通过包…

    2025年12月15日
    000
  • 在Golang微服务架构中跨服务传递错误的最佳实践是什么

    在Golang微服务中,跨服务传递错误的最佳实践包括定义统一错误结构体、利用context传递追踪ID,并通过gRPC或HTTP协议高效传输。2. 统一错误结构体应包含Code、Message、Details和TraceID字段,实现error接口以便集成。3. 使用context.Context在…

    2025年12月15日
    000
  • 如何获取变量类型 reflect.TypeOf方法详解

    reflect.TypeOf用于获取变量的类型信息,返回reflect.Type接口。它只关注类型而非值,适用于动态类型处理、通用函数编写等场景。通过Kind、Name、Elem等方法可深入分析结构体、指针、切片等复杂类型,是实现序列化、泛型逻辑的重要工具,但需注意性能与类型安全。 在Go语言中,r…

    2025年12月15日
    000
  • Fedora系统安装Golang开发环境的推荐方法

    推荐使用dnf安装Golang,命令为sudo dnf install golang,可自动安装稳定版并配置PATH;2. 手动下载官网二进制包虽灵活但维护麻烦,dnf方式更省心;3. 配置GOPATH和PATH:创建~/go目录,将export GOPATH=$HOME/go和export PAT…

    2025年12月15日
    000
  • 如何使用Golang的net包实现一个支持多用户的TCP聊天室服务器

    使用Golang的net包实现TCP聊天室需监听端口、管理连接、广播消息;2. 每个客户端连接由独立goroutine处理,通过channel广播消息;3. clients map用sync.Mutex保护,确保并发安全;4. handleBroadcast持续监听broadcast channel…

    2025年12月15日
    000
  • 探索Python调用Go函数的途径:SWIG与Cython的实践考量

    本文深入探讨了在Python中调用Go函数的可行方案,主要聚焦于SWIG和Cython这两种跨语言工具。鉴于Go语言可以通过cgo等机制生成C兼容代码,理论上可以通过SWIG为这些C接口生成Python绑定,或利用Cython直接封装C函数。文章详细分析了这两种方法的实现路径、关键技术点,特别是Cy…

    2025年12月15日
    000
  • Golang中当函数返回多个值时错误处理代码的推荐写法

    Go语言推荐在函数返回多值时立即检查error,若err不为nil则优先处理错误,避免使用无效结果。核心做法是使用if err != nil进行显式判断,确保错误被处理,提升代码健壮性。典型模式为:调用函数后立即检查error,根据err是否为nil决定后续流程。可通过fmt.Errorf配合%w包…

    2025年12月15日
    000
  • Go语言方法接收器深度解析:理解指针与值的选择与影响

    Go语言中的方法可以声明为值接收器或指针接收器。尽管Go允许通过值或指针变量调用这两种类型的方法,但它们在修改原始数据方面的能力截然不同。指针接收器方法能够修改其接收者的底层值,而值接收器方法操作的是接收者的一个副本,因此无法改变原始数据。理解这一核心差异对于编写高效且行为正确的Go代码至关重要。 …

    2025年12月15日
    000
  • Python调用Go函数:SWIG与Cython的桥接策略探讨

    本文探讨了从Python调用Go函数的两种主要策略。鉴于SWIG在Go生态中常用于Go调用C/C++,我们首先考虑通过Go的c++go机制将Go函数编译为C,再利用SWIG生成Python绑定。其次,更直接的方案是利用Cython将Go编译出的C代码封装为Python模块,甚至通过精细化Cython…

    2025年12月15日
    000

发表回复

登录后才能评论
关注微信