高效生成稀疏邻接矩阵的COO格式数据

程序猿 • 2025年12月14日 14:41:51 • 好文分享 • 阅读 0

本文旨在教授如何高效地在Python中生成用于稀疏邻接矩阵（特别是COO格式）的行（row）和列（col）索引，以确保矩阵对角线元素为零（即无自环）。我们将探讨使用NumPy生成所有非对角线索引的方法，以及如何从已有的COO格式数据构建矩阵，并最终将其应用于Scipy的稀疏矩阵构建。

在图论和网络分析中，邻接矩阵是一种常用的数据结构，用于表示图中节点之间的连接关系。当图是无向图且不包含自环（即节点不与自身连接）时，其邻接矩阵的对角线元素应为零。对于大型图，使用稀疏矩阵格式（如COO, Coordinate List）可以显著节省存储空间并提高计算效率。本教程将重点解决如何生成符合这些要求的row和col索引数组。

1. 理解问题背景

用户最初的需求是生成两个列表 row 和 col，它们将用于构建一个对角线为零的邻接矩阵。row 列表可以通过重复项目来生成，例如 [0, 0, 1, 1, 2, 2]。然而，col 列表的生成需要特别注意，以确保其与 row 列表中的对应元素不相等，从而避免矩阵对角线上的元素被赋值。例如，当 row[i] = 0 时，col[i] 必须不能是 0。

原始问题中的 col = [1, 2, 0, 2, 0, 1] 配合 row = [0, 0, 1, 1, 2, 2] 可以成功构建一个对角线为零的3×3邻接矩阵：

import scipy.sparseimport numpy as nprow = [0, 0, 1, 1, 2, 2]col = [1, 2, 0, 2, 0, 1]value = [1, 1, 1, 1, 1, 1] # 假设所有连接的权重为1mtx = scipy.sparse.coo_matrix((value, (row, col)), shape=(3, 3))print(mtx.todense())

输出：

[[0 1 1] [1 0 1] [1 1 0]]

我们的目标是学习如何系统地生成这样的 row 和 col 数组。

2. 方法一：生成所有非对角线索引

如果需要填充矩阵的所有非对角线位置，NumPy提供了一种非常简洁高效的方法来生成所有 (row, col) 对，其中 row != col。

核心思想： 利用NumPy的广播机制和条件筛选。我们可以创建一个表示行索引的数组和一个表示列索引的数组，然后通过比较它们来找出所有不相等的索引对。

import numpy as npn, m = 3, 3 # 定义矩阵的维度，例如3x3# 生成所有非对角线索引对# np.arange(m)[:, None] 创建一个列向量 [0, 1, 2]^T# np.arange(n) 创建一个行向量 [0, 1, 2]# 两者进行比较时，会发生广播，生成一个 n x m 的布尔矩阵# 矩阵元素 (i, j) 为 True 当且仅当 i != jrow, col = np.where(np.arange(m)[:, None] != np.arange(n))print("生成的行索引 (row):", row)print("生成的列索引 (col):", col)# 假设我们有一些值需要填充这些位置value = [1, 3, 7, 2, 1, 4] # 值的数量需要与row/col的长度匹配# 验证：将这些值填充到稠密矩阵中a = np.zeros((n, m), dtype=int)a[row, col] = valueprint("n填充后的稠密矩阵:")print(a)

输出：

生成的行索引 (row): [0 0 1 1 2 2]生成的列索引 (col): [1 2 0 2 0 1]填充后的稠密矩阵:[[0 1 3] [7 0 2] [1 4 0]]

解释：

np.arange(m)[:, None] 创建了一个形状为 (m, 1) 的数组，代表矩阵的行索引。np.arange(n) 创建了一个形状为 (n,) 的数组，代表矩阵的列索引。当这两个数组进行 != 比较时，NumPy的广播机制会将其扩展为 (m, n) 形状的布尔矩阵。例如，对于 (3, 3) 矩阵，它会生成：

[[F, T, T], [T, F, T], [T, T, F]]

其中 F 表示 False (对角线元素)，T 表示 True (非对角线元素)。

np.where() 函数会返回所有 True 元素的坐标，即 (row_indices, col_indices)。这些索引对精确地对应了矩阵中所有非对角线的位置。这种方法适用于需要填充所有非对角线元素，或者需要获取所有可能的非自环连接的情况。

3. 方法二：从给定COO数据构建矩阵

在某些情况下，你可能已经拥有了 row、col 和 value 数组，只是需要将它们组装成一个稠密矩阵或稀疏矩阵。这种方法更通用，因为它不假设你需要填充所有非对角线元素，而是根据你提供的具体 (row, col) 对进行操作。

核心思想： 初始化一个全零的稠密矩阵，然后使用NumPy的高级索引功能，根据 row 和 col 数组将 value 填充到相应位置。

import numpy as np# 假设我们已经有了一些COO格式的数据row_coords = [0, 1, 2, 2]col_coords = [1, 2, 0, 1]values = [1, 2, 3, 4]# 确定矩阵的维度# 如果只知道row_coords和col_coords，可以通过取最大值加1来确定n = np.max(row_coords) + 1 if row_coords else 0m = np.max(col_coords) + 1 if col_coords else 0# 也可以直接指定，例如 n, m = 3, 3n, m = 3, 3 # 初始化一个全零的稠密矩阵a = np.zeros((n, m), dtype=int)# 使用高级索引将值填充到指定位置a[row_coords, col_coords] = valuesprint("从给定COO数据构建的稠密矩阵:")print(a)

输出：

从给定COO数据构建的稠密矩阵:[[0 1 0] [0 0 2] [3 4 0]]

解释：

np.zeros((n, m), dtype=int) 创建了一个指定大小的全零矩阵。a[row_coords, col_coords] = values 是NumPy的高级索引功能。它会遍历 row_coords 和 col_coords 中的对应元素，并将 values 中相应的值赋给 a[row_coords[i], col_coords[i]]。这种操作非常高效。这种方法适用于当你已经有了需要表示的特定连接列表时，无论这些连接是否覆盖了所有非对角线元素。

4. 结合 Scipy.sparse.coo_matrix

无论是通过方法一生成的 row 和 col，还是通过方法二提供的现有数据，最终目标通常是构建一个稀疏矩阵。Scipy库提供了 scipy.sparse.coo_matrix 来实现这一点。

import numpy as npimport scipy.sparse# 示例1：使用方法一生成的全部非对角线索引n_nodes = 3row_all_nondiagonal, col_all_nondiagonal = np.where(np.arange(n_nodes)[:, None] != np.arange(n_nodes))value_all_nondiagonal = np.ones_like(row_all_nondiagonal, dtype=int) # 假设所有连接权重为1print("方法一生成的COO数据:")print("row:", row_all_nondiagonal)print("col:", col_all_nondiagonal)print("value:", value_all_nondiagonal)sparse_mtx_1 = scipy.sparse.coo_matrix((value_all_nondiagonal, (row_all_nondiagonal, col_all_nondiagonal)), shape=(n_nodes, n_nodes))print("n方法一构建的稀疏矩阵 (稠密表示):")print(sparse_mtx_1.todense())# 示例2：使用自定义的COO数据custom_row = [0, 1, 2, 2]custom_col = [1, 2, 0, 1]custom_value = [5, 6, 7, 8]matrix_shape = (3, 3)print("n自定义COO数据:")print("row:", custom_row)print("col:", custom_col)print("value:", custom_value)sparse_mtx_2 = scipy.sparse.coo_matrix((custom_value, (custom_row, custom_col)), shape=matrix_shape)print("n自定义数据构建的稀疏矩阵 (稠密表示):")print(sparse_mtx_2.todense())

输出：

方法一生成的COO数据:row: [0 0 1 1 2 2]col: [1 2 0 2 0 1]value: [1 1 1 1 1 1]方法一构建的稀疏矩阵 (稠密表示):[[0 1 1] [1 0 1] [1 1 0]]自定义COO数据:row: [0 1 2 2]col: [1 2 0 1]value: [5 6 7 8]自定义数据构建的稀疏矩阵 (稠密表示):[[0 5 0] [0 0 6] [7 8 0]]

scipy.sparse.coo_matrix 的构造函数接受三个参数：data (即 value 数组), (row, col) (一个包含行索引数组和列索引数组的元组), 以及 shape (矩阵的维度)。这种格式非常适合表示稀疏矩阵，因为它只存储非零元素的位置和值。

5. 注意事项与总结

NumPy的效率： NumPy数组操作是高度优化的，尤其适用于大规模数据。使用 np.where 和高级索引比Python原生的循环操作要快得多。稀疏矩阵的优势： 对于节点数量巨大但连接稀疏的图，使用 scipy.sparse.coo_matrix 或其他稀疏矩阵格式（如CSR, CSC）可以大幅减少内存占用，并提高涉及矩阵乘法、求逆等操作的计算效率。方法选择：如果你需要构建一个包含所有非自环连接的完全图（或其子集，但所有非对角线位置都有可能被填充），方法一 (np.where) 是最直接和高效的。如果你已经有了一组特定的连接（例如从文件中读取的边列表），并且这些连接可能不覆盖所有非对角线位置，那么直接使用这些 row、col 和 value 数组与 scipy.sparse.coo_matrix 结合是最佳选择。维度确定： 在从现有 row 和 col 数组构建矩阵时，务必正确指定 shape 参数。如果不知道确切的维度，可以通过 (np.max(row) + 1, np.max(col) + 1) 来推断。

通过本文的介绍，您应该能够高效地在Python中生成和管理用于构建无自环稀疏邻接矩阵的COO格式数据。这对于处理大规模图数据和进行网络分析至关重要。

以上就是高效生成稀疏邻接矩阵的COO格式数据的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1375073.html

go node python 内存占用

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Pyheif安装教程：解决缺失libheif依赖的问题

上一篇 2025年12月14日 14:41:42

Python文件读取与字符串验证：解决换行符陷阱与优化文件操作

下一篇 2025年12月14日 14:41:53

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
2000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
0000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
0000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
3000
好文分享

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
3000
好文分享

HTML5怎么制作广告_HTML5用动画与交互制横幅或弹窗广告吸引点击【制作】

可利用HTML5结合CSS3动画、Canvas、Web Animations API、Intersection Observer和video标签制作互动广告：一用@keyframes实现横幅入场动画；二用Canvas绘制并响应悬停；三用Web Animations API控制弹窗时序；四用Inter…

程序猿
2025年12月23日
0000
好文分享

html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

应通过 HTTP 服务运行打包后的 HTML5 页面，而非双击打开：一、Webpack 配 webpack-dev-server 启动本地服务；二、Gulp 配 BrowserSync 提供实时重载；三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录；四、仅当必须双击运行…

程序猿
2025年12月23日
0000
好文分享

html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

首先检查文件扩展名和编码格式，确保为.html且使用UTF-8编码；接着验证HTML5结构完整性，包含及正确闭合的标签；然后排查外部资源路径是否正确，利用开发者工具查看404错误；排除浏览器兼容性问题，优先在现代浏览器中测试并避免未广泛支持的API；检查JavaScript语法错误与执行顺序，确保脚…

程序猿
2025年12月23日
0000
好文分享

html5如何建立站点_HTML5站点建立步骤与网站搭建技巧【指南】

HTML5网站搭建需五步：一、建my-website目录及css/js/images子目录，含index.html；二、写标准HTML5骨架，含DOCTYPE、lang、meta、语义化标签；三、外链CSS与defer/async脚本；四、用http-server启本地服务；五、用email/num…

程序猿
2025年12月23日
0000
好文分享

html5怎么写app_HTML5用PWA或WebView打包成类APP的网页应用【编写】

可通过PWA、WebView（Android/iOS）、Cordova或Capacitor五种方式将HTML5网页转为类原生APP：PWA依赖Manifest与Service Worker实现安装与离线；WebView分别在Android Studio和Xcode中加载本地资源；Cordova与Ca…

程序猿
2025年12月23日
0000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
2000
好文分享

html5怎么引入字体_HTML5用@font-face引入本地或网络字体文件【引入】

需用CSS的@font-face规则加载自定义字体，步骤包括：准备WOFF2/WOFF/TTF多格式文件并存放至项目目录；在CSS中为每种字重和样式单独声明@font-face；通过font-family应用字体；可选Google Fonts外链方式；添加font-display: swap缓解FO…

程序猿
2025年12月23日
0000
好文分享

如何操作html_操作HTML元素的常用方法【常用】

必须掌握操作HTML元素的五种核心方法：一、通过ID精准获取并修改单个元素；二、通过类名批量操作多个元素；三、用querySelector系列灵活选择任意CSS匹配元素；四、动态创建并插入新元素；五、安全移除或替换现有元素。如果您需要动态修改网页内容或响应用户交互，则必须掌握操作HTML元素的核心…

程序猿
2025年12月23日
2000
好文分享

html5如何插入txt纯文本_html5txt文本嵌入与编码设置【实操】

可通过iframe、fetch+pre、object标签或服务端预处理四种方式在HTML5中显示外部TXT文件，需重点处理字符编码（如UTF-8声明、BOM、响应头）并防范XSS风险。如果您希望在HTML5页面中显示外部TXT纯文本文件的内容，浏览器默认不支持直接嵌入TXT文件为可渲染内容，必须通…

程序猿
2025年12月23日
0000
好文分享

怎么用html5链接_html5用a标签href属性给文字或图片加跳转链接【使用】

HTML5中使用a元素配合href属性实现跳转：可为文字、图片添加超链接；支持绝对URL、相对路径及页面内锚点；通过target=”_blank”和rel=”noopener”可在新标签页安全打开链接。如果您希望在网页中为文字或图片添加可点击的跳转功…

程序猿
2025年12月23日
3000
好文分享

如何运行html代码_html代码运行方法【步骤】

HTML代码需保存为.html文件并用浏览器打开才能正确显示；若含AJAX或外部资源则需本地服务器；临时测试可用开发者工具；在线编辑器支持即时预览。如果您编写了一段HTML代码，但无法在浏览器中正确显示效果，则可能是由于文件未以正确的格式保存或未通过浏览器打开。以下是运行HTML代码的具体步骤： …

程序猿
2025年12月23日
0000