NumPy中大型重复矩阵的视图限制与高效处理策略

程序猿 • 2025年11月10日 06:21:44 • 后端开发 • 阅读 0

本文探讨了在numpy中构建大型重复矩阵时，尝试将其作为小矩阵的视图以节省内存的挑战。我们分析了为何`numpy.broadcast_to`和`reshape`的组合无法实现视图，以及numpy数组步长（strides）机制在此限制中的作用。同时，文章将指导读者如何针对这类矩阵的特定计算需求，采用更高效的替代方案，避免不必要的内存消耗和计算开销。

NumPy中大型重复矩阵的构建需求

在科学计算中，我们有时会遇到需要构建一个由较小矩阵重复构成的大型矩阵的场景。例如，给定一个 M x M 的基础矩阵 s，我们希望构建一个 N*M x N*M 的大矩阵 S，其中 S 的每个 M x M 子块都与 s 完全相同。

以 M=2 和 N=3 为例：如果基础矩阵 s 为：

s = np.array([[1,2],              [3,4]])

我们期望构建的大矩阵 S 如下所示：

S = np.array([[1,2,1,2,1,2],              [3,4,3,4,3,4],              [1,2,1,2,1,2],              [3,4,3,4,3,4],              [1,2,1,2,1,2],              [3,4,3,4,3,4]])

构建此类矩阵的一个常见目标是利用NumPy的视图（view）机制来节省内存，避免实际复制数据。

尝试使用broadcast_to和reshape

为了以视图方式构建 S，一种直观的尝试是结合使用 numpy.broadcast_to 和 reshape。broadcast_to 可以将数组广播到更大的形状，通常会返回一个视图。然后，reshape 尝试将这个广播后的多维数组转换为所需的二维矩阵。

以下是这种尝试的代码示例：

import numpy as npN = 10000M = 10w = np.random.rand(N * M, 1) # 辅助变量，用于后续计算示例s = np.random.rand(M, M)# 尝试构建 S# 首先将 s 广播到 (N, N, M, M) 的四维形状S4d = np.broadcast_to(s, shape=(N, N, M, M))# 接着尝试将四维数组重塑为 (N*M, N*M) 的二维矩阵S = S4d.reshape(N * M, N * M)

然而，当 N 和 M 的值较大时（例如 N=10000, M=10），上述代码会抛出 numpy.core._exceptions._ArrayMemoryError：

numpy.core._exceptions._ArrayMemoryError: Unable to allocate 74.5 GiB for an array with shape (10000, 10000, 10, 10) and data type float64

这个错误表明即使是中间的 S4d 数组，其所需的内存也达到了74.5 GiB，超出了系统可用内存。更关键的是，即使内存足够，reshape 操作也无法在这种情况下返回一个 s 的视图。

NumPy视图机制与步长（Strides）的限制

NumPy数组的视图机制依赖于其内存布局和步长（strides）。步长定义了在数组的某个维度上，从一个元素移动到下一个元素时，内存地址需要跳过的字节数。一个数组只有当其内存布局允许通过调整步长来表示新形状时，才能以视图的形式进行重塑。

对于我们期望构建的矩阵 S，其内部结构是 s 的重复平铺。如果 S 是 s 的视图，那么在 S 的任意一行中，每隔 M 个元素，数据会从 s 的一行重新开始。这意味着在 S 的某个维度上，内存访问模式将是不均匀的：在 s 内部是连续的，但在 s 的不同副本之间则需要“跳跃”到 s 的起始位置。这种非均匀的内存访问模式与NumPy数组的固定步长要求相冲突。

乾坤圈新媒体矩阵管家

新媒体账号、门店矩阵智能管理系统

17 查看详情

numpy.broadcast_to 确实可以创建视图，它通过调整步长和添加维度来实现广播，而无需复制数据。例如，一个 (M, M) 的数组 s 广播到 (N, N, M, M) 的 S4d 数组时，S4d 确实是 s 的一个视图。然而，当尝试将这个 S4d 视图 reshape 为 (N*M, N*M) 的 S 时，NumPy发现无法通过简单调整步长来满足这种新的、更扁平的二维布局，同时保持 s 的重复模式。此时，reshape 会尝试创建一个新的、内存连续的数组来存储 S 的所有元素。由于 S 的总元素数量非常庞大（(N*M)^2），这将导致巨大的内存分配需求，从而引发 _ArrayMemoryError。

简而言之，S 无法作为 s 的视图创建，因为其所需的重复模式在内存中不是通过一致的步长可以表达的。

高效处理策略：避免显式构建大矩阵

在许多情况下，我们并不需要显式地构建出整个大型重复矩阵 S，而是需要它参与特定的数学运算。例如，问题中提到的计算 w’ * S * w。对于这类具有高度重复结构的矩阵，通常可以通过数学推导找到更高效的计算方法，从而完全避免构建庞大的 S 矩阵。

考虑 w’ * S * w 的计算：其中 w 是一个 (N*M) x 1 的列向量，S 是一个 (N*M) x (N*M) 的矩阵，由 N x N 个 M x M 的 s 块组成。我们可以将 w 向量视为 N 个 M x 1 的子向量 w_0, w_1, …, w_{N-1} 的堆叠。那么 w’ * S * w 可以展开为：w’ * S * w = sum_{i=0}^{N-1} sum_{j=0}^{N-1} (w_i^T @ s @ w_j)

这个表达式可以进一步简化：w’ * S * w = (sum_{i=0}^{N-1} w_i^T) @ s @ (sum_{j=0}^{N-1} w_j)

令 W_sum = sum_{i=0}^{N-1} w_i，这是一个 M x 1 的向量。那么，原始的复杂计算就简化为：W_sum^T @ s @ W_sum

这个简化后的计算涉及一个 1 x M 向量、一个 M x M 矩阵和一个 M x 1 向量的乘法，其计算量远小于直接操作 (N*M) x (N*M) 的 S 矩阵。

以下是使用这种高效策略进行计算的示例代码：

import numpy as npN = 10000M = 10# 随机生成测试数据w = np.random.rand(N * M, 1) # N*M x 1 列向量s = np.random.rand(M, M)     # M x M 基础矩阵# 1. 将 w 重塑为 N 行 M 列的矩阵，每一行代表一个 w_i# w_blocks 的形状为 (N, M)w_blocks = w.reshape(N, M)# 2. 对 w_blocks 沿第一个轴（N轴）求和，得到 W_sum# W_sum 的形状为 (1, M) 或 (M,)，这里使用 keepdims=True 保持二维形状 (1, M)W_sum = w_blocks.sum(axis=0, keepdims=True)# 3. 执行简化后的矩阵乘法 W_sum^T @ s @ W_sum# 注意：W_sum 是 (1, M)，其转置 W_sum.T 是 (M, 1)result_efficient = W_sum @ s @ W_sum.Tprint(f"高效计算结果: {result_efficient}")print(f"W_sum 的形状: {W_sum.shape}")print(f"s 的形状: {s.shape}")print(f"W_sum.T 的形状: {W_sum.T.shape}")

对于 N=10000, M=10 的情况，这种计算可以在极短的时间内完成，而无需分配任何大型矩阵。

总结与注意事项

NumPy视图的限制：虽然NumPy的视图机制非常强大，可以有效节省内存，但它并非万能。视图的创建受限于底层数据的内存布局和NumPy的步长（strides）规则。对于需要非均匀内存访问模式的复杂重复结构，NumPy无法创建视图。内存错误处理：当遇到 _ArrayMemoryError 时，这通常意味着你正在尝试分配一个远超系统能力的数组。此时，应重新审视你的算法和数据结构，看是否可以避免显式构建如此庞大的数组。数学简化：对于具有高度重复或对称结构的矩阵，在进行矩阵运算时，往往可以通过数学推导找到简化的计算方法。这种方法通常能将计算复杂度从 O((NM)^2) 甚至 O((NM)^3) 降低到 O(M^2) 或 O(M^3)，从而在性能和内存使用上取得巨大优势。NumPy平铺功能：如果确实需要一个物理上存在的重复矩阵（例如用于可视化或某些特定操作），可以使用 np.tile 函数。但请注意，np.tile 会创建数据的副本，因此同样会消耗大量内存。例如 S = np.tile(s, (N, N))。在大多数情况下，应优先考虑数学简化而非物理构建。

通过理解NumPy的内部机制并结合数学分析，我们可以在处理大型矩阵问题时，设计出既高效又内存友好的解决方案。

以上就是NumPy中大型重复矩阵的视图限制与高效处理策略的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/571777.html

字节

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

使用Pandas和NumPy高效计算首个唯一值分组汇总

上一篇 2025年11月10日 06:21:06

使用spaCy EntityRuler扩展命名实体识别：精准捕获自定义日期模式

下一篇 2025年11月10日 06:21:56

好文分享

html5怎么读取文件_html5用FileReader API读取本地文件内容或属性【读取】

HTML5的FileReader API支持读取本地文件内容及获取基本信息：一、通过input type=”file”获取File对象；二、用readAsText读取文本；三、用readAsDataURL生成Data URL预览资源；四、用readAsArrayBuffer读…

程序猿
2025年12月23日
0000
html如何编写_编写规范HTML代码的要点【要点】

编写结构清晰、语义准确且易于维护的HTML需遵循七项规范：一、正确声明DOCTYPE；二、完整设置html根元素与lang属性；三、合理组织head与body结构；四、优先使用语义化标签；五、严格闭合可闭合标签；六、为媒体元素提供必需属性；七、统一使用双引号包裹属性值。如果您希望编写出结构清晰、语…

程序猿
2025年12月23日 • 好文分享
0000
好文分享

html5怎样设计进度条组件_html5进度条制作与动态效果实现【教程】

HTML5原生元素可直观展示任务进度，支持CSS定制样式、JavaScript动态更新、requestAnimationFrame平滑动画及结合XMLHttpRequest实现文件上传实时进度。如果您希望在网页中直观展示任务完成进度，HTML5 提供了原生的元素，同时支持通过 CSS 样式定制外…

程序猿
2025年12月23日
0000
好文分享

bootstrap怎么设置html5_Bootstrap选HTML5模板或加视口元标签设置【设置】

Bootstrap 页面移动设备显示异常的根源是 HTML5 Doctype 未声明或 viewport 元标签缺失；需依次设置、、和。如果您在使用 Bootstrap 构建网页时发现页面在移动设备上显示异常、缩放失当或布局错乱，则很可能是 HTML5 文档类型未声明或视口（viewport…

程序猿
2025年12月23日
0000
好文分享

jimdo怎么插入html53d模型_jimdo3d模型html5嵌入与旋转控制【指南】

Jimdo网站嵌入交互式3D模型有三种主流方法：一、用iframe嵌入Sketchfab等平台托管的GLB模型；二、通过自定义HTML区块引入Three.js加载本地GLB并配置OrbitControls；三、使用Google Model Viewer Web组件声明式嵌入，支持AR与iOS兼容。 …

程序猿
2025年12月23日
0000
好文分享

如何转为html5_将传统HTML转换为HTML5标准【传统】

需将旧版HTML升级为HTML5：一、用替换旧DOCTYPE；二、根元素改为并移除xmlns；三、用声明编码；四、用等语义标签替代div；五、更新表单type和required属性，改用子元素并添加controls。如果您正在维护一个使用旧版HTML编写的网页，但希望其符合现代Web标准，则需要将…

程序猿
2025年12月23日
0000
好文分享

html如何优化_优化HTML代码性能与加载速度【性能】

网页加载缓慢等问题源于HTML冗余、资源阻塞或语义不当，需从精简标记、优化资源加载、启用现代特性、减少重排重绘、配置服务器传输五方面优化。如果您发现网页加载缓慢、首屏渲染时间过长或Lighthouse评分偏低，则可能是HTML结构冗余、资源加载阻塞或语义不当所致。以下是优化HTML代码性能与加载速…

程序猿
2025年12月23日
0000
好文分享

html5游戏怎么加密_html5用JS混淆或加密工具保护游戏代码逻辑【加密】

HTML5游戏可通过四种方法保护JavaScript逻辑：一、使用javascript-obfuscator混淆代码；二、多层字符串编码+动态eval解密；三、模块拆分+AES加密动态加载；四、WebAssembly封装核心算法。如果您开发了HTML5游戏并希望防止他人轻易查看或复制核心JavaS…

程序猿
2025年12月23日
0000
好文分享

html如何执行_浏览器执行HTML代码的过程【过程】

浏览器按顺序执行HTML：先发起网络请求获取HTML及外部资源；再解析HTML构建DOM树，遇JS暂停解析并执行；同时解析CSS构建CSSOM树，最后结合二者渲染页面。当您在浏览器中打开一个HTML文件时，浏览器会按照特定顺序解析和渲染页面内容。以下是浏览器执行HTML代码的详细过程：一、网络请…

程序猿
2025年12月23日
0000
好文分享

HTML如何在浏览器显示_渲染原理与调试技巧【指南】

HTML渲染异常需按浏览器流程调试：解析DOM/CSSOM→构建渲染树→布局→绘制；用DevTools检查结构、样式、重绘/图层；排查display/visibility、浮动塌陷、定位基准等问题；验证DOCTYPE与HTML合法性。如果您在编写HTML代码后发现页面在浏览器中显示异常或渲染效果与…

程序猿
2025年12月23日
0000
好文分享

Html如何压缩图片_HTML页面中压缩图片大小方法【压缩】

压缩HTML图片可从五方面入手：一、用TinyPNG等工具在线压缩；二、用srcset实现响应式图片；三、转为WebP/AVIF格式并用标签兼容；四、按实际尺寸裁剪并设width/height属性；五、通过CDN或Nginx动态压缩。如果您在HTML页面中嵌入图片时发现页面加载缓慢，可能是由于图片…

程序猿
2025年12月23日
0000
好文分享

HTML文档如何正确保存_格式与编码设置【指南】

HTML文档显示乱码或样式异常，主因是编码设置错误；须用纯文本编辑器、保存为UTF-8无BOM格式、确保扩展名为.html、在head中声明，并用命令行校验BOM。如果您创建了一个HTML文档，但浏览器显示乱码或样式异常，则可能是由于文件保存格式或字符编码设置不正确。以下是确保HTML文档正确保存…

程序猿
2025年12月23日
0000
好文分享

如何声明html_声明HTML文档类型与版本【类型】

标准HTML文档需在首行声明DOCTYPE：HTML5用；HTML4.01 Strict用带URL的公共标识符；XHTML1.0 Transitional需xmlns属性和XML语法；HTML5完整声明需加lang和charset。如果您需要创建一个标准的HTML文档，必须在文件开头明确声明文档类…

程序猿
2025年12月23日
0000
好文分享

html5如何上传图片_HTML5图片上传实现与表单技巧【教程】

HTML5可通过input file控件、FileReader预览图片，校验类型大小，用FormData提交，并借助Canvas压缩及multiple属性实现批量上传。如果您希望在网页中实现图片上传功能，HTML5 提供了原生的文件选择控件与 JavaScript API 支持，无需依赖第三方插件…

程序猿
2025年12月23日
0000
好文分享

html如何保存照片_HTML页面实现照片保存功能【照片】

可通过五种前端方法实现照片本地保存：一、a标签download属性；二、Canvas绘制导出Blob；三、Fetch API获取二进制数据；四、Base64编码直接下载；五、服务端代理规避CORS。如果您在HTML页面中显示了一张照片，但希望用户能够直接将该照片保存到本地设备，则需要通过前端技术触…

程序猿
2025年12月23日
0000
好文分享

如何提升HTML加载信号_性能优化策略详解【方案】

提升HTML加载性能需五策：一、精简文档体积，移除注释空格、提取内外联资源、删减冗余标签；二、启用Gzip/Brotli压缩；三、DNS预解析与预连接；四、async/defer脚本加载；五、服务端流式传输。如果您发现网页加载缓慢，信号响应延迟，可能是由于HTML资源加载路径冗长、阻塞渲染或网络传…

程序猿
2025年12月23日
0000
好文分享

如何做html5_制作HTML5页面基础步骤【制作】

HTML5网页制作需五步：一、首行声明；二、构建结构；三、在中添加、viewport和charset元标签；四、用等语义化标签组织内容；五、以UTF-8编码保存为.html文件并用W3C验证器校验。如果您希望创建一个符合现代标准的网页，HTML5 是当前最基础且广泛支持的标记语言。以下是制作 HT…

程序猿
2025年12月23日
0000
好文分享

html5传文件实现_FormData与File API上传文件【方法】

HTML5文件上传支持单/多文件、带字段及进度监控，核心方案为FormData配合XMLHttpRequest或Fetch，辅以FileReader预览、客户端校验等增强功能。如果您需要在网页中实现文件上传功能，HTML5 提供了 FormData 与 File API 的组合方案，可支持单文件、…

程序猿
2025年12月23日
0000
好文分享

html是如何工作的_html工作原理详解【教程】

HTML 工作流程分为五步：一、解析 HTML 构建 DOM 树；二、加载并解析 CSS 生成 CSSOM；三、合并 DOM 与 CSSOM 形成渲染树；四、布局计算各节点几何信息；五、绘制像素并图层合成显示。当您在浏览器中输入一个网址并按下回车键，HTML 文档便开始参与页面的构建过程。浏览器接…

程序猿
2025年12月23日
0000
好文分享

html怎么在cmd下运行php_cmd运行html中php方法【教程】

首先确认PHP已安装并配置环境变量，通过php -v验证；其次建议将含PHP代码的文件改为.php扩展名，并使用php -S启动内置服务器运行；若需在CMD中直接执行，可使用php -r运行内联代码；如需保留.html扩展名，应配置Apache或Nginx将HTML文件交由PHP解析；最后确保文件编…

程序猿
2025年12月23日
0000