SLURM 并行执行：在多个文件上运行相同的 Python 脚本

程序猿 • 2025年11月11日 10:52:27 • 后端开发 • 阅读 0

本文档旨在指导用户如何在 SLURM 环境下，利用并行计算能力，高效地在多个输入文件上运行同一个 Python 脚本。我们将探讨如何正确配置 SLURM 脚本，利用 srun 命令分配任务，以及如何使用 Job Arrays 简化流程，从而充分利用集群资源，加速数据处理。

使用 srun 并行化 Python 脚本

当需要在 SLURM 集群上并行运行同一脚本处理多个文件时，srun 命令是关键。与 sem (GNU parallel) 不同，srun 与 SLURM 调度器紧密集成，能更好地利用分配的资源。

以下是一个示例 SLURM 脚本，展示了如何使用 srun 在多个节点上并行执行 Python 脚本：

#!/bin/bash#SBATCH --nodes=8#SBATCH --ntasks-per-node=128INPUT_DIR='path/to/input/dir'OUTPUT_DIR='/path/to/output/dir'# 将文件名读入数组INPUT_STEMS_FILE='/some/path/to/list/of/inputs.txt'INPUT_STEMS=()while IFS= read -r line; do  INPUT_STEMS+=("$line")done < <(tr -d 'r'  "$OUTPUT_FILE_NAME" &donewait

代码解释：

立即学习“Python免费学习笔记（深入）”；

#SBATCH 指令： 定义了 SLURM 作业的资源需求，例如节点数量 (–nodes) 和每个节点的任务数量 (–ntasks-per-node)。请务必根据集群的具体配置调整这些参数。读取文件名： 从文件中读取输入文件名，并将其存储在数组 INPUT_STEMS 中。循环迭代： 使用 for 循环遍历文件名数组，为每个文件创建一个任务。轮询分配： 使用取模运算 (%) 将任务轮询分配到不同的节点。$SLURM_NNODES 变量包含了分配的节点总数。动态生成文件名： 根据循环索引动态生成输入和输出文件名。srun 命令： 使用 srun 命令在指定的节点上运行 Python 脚本。-N1 -n1 指定每个任务使用 1 个节点和 1 个核心。-w $(( $(hostname -s) $NODE_NUMBER )) 指定在特定节点上运行任务，其中 $NODE_NUMBER 是轮询分配的节点索引。python_script.py –input “$INPUT_FILE_NAME” > “$OUTPUT_FILE_NAME” 是实际执行的 Python 脚本，并将输出重定向到指定的输出文件。& 符号将任务放入后台运行，实现并行执行。wait 命令： 等待所有后台任务完成。

注意事项：

请根据实际情况修改 INPUT_DIR、OUTPUT_DIR 和 INPUT_STEMS_FILE 变量。确保 Python 脚本 python_script.py 可执行，并且能够正确处理输入文件。根据集群的节点配置和任务需求，调整 –nodes 和 –ntasks-per-node 参数。-w 参数可能需要根据集群的具体配置进行调整。某些集群可能需要使用不同的方式来指定节点。hostname -s 命令用于获取当前节点的主机名。

使用 Job Arrays 简化并行执行

SLURM 的 Job Arrays 提供了一种更简洁的方式来并行执行多个任务。通过 Job Arrays，可以将多个相似的任务作为一个整体提交，SLURM 会自动为每个任务分配资源。

行者AI

行者AI绘图创作，唤醒新的灵感，创造更多可能

100 查看详情

以下是一个使用 Job Arrays 的示例 SLURM 脚本：

#!/bin/bash#SBATCH --array=0-999#SBATCH --nodes=1#SBATCH --ntasks-per-node=1INPUT_DIR='path/to/input/dir'OUTPUT_DIR='/path/to/output/dir'# 将文件名读入数组INPUT_STEMS_FILE='/some/path/to/list/of/inputs.txt'INPUT_STEMS=()while IFS= read -r line; do  INPUT_STEMS+=("$line")done < <(tr -d 'r'  "$OUTPUT_FILE_NAME"

代码解释：

立即学习“Python免费学习笔记（深入）”；

#SBATCH –array=0-999： 定义了一个 Job Array，包含 1000 个任务，索引从 0 到 999。$SLURM_ARRAY_TASK_ID： SLURM 会为每个任务设置一个环境变量 $SLURM_ARRAY_TASK_ID，表示当前任务的索引。动态生成文件名： 根据 $SLURM_ARRAY_TASK_ID 动态生成输入和输出文件名。执行 Python 脚本： 使用 Python 脚本处理指定的输入文件，并将结果输出到指定的输出文件。

使用 Job Arrays 的优点：

简化了 SLURM 脚本，减少了代码量。更方便地管理和监控多个任务。SLURM 可以更有效地分配资源，提高集群利用率。

注意事项：

请根据实际情况修改 –array 参数，指定 Job Array 的任务数量和索引范围。确保 $SLURM_ARRAY_TASK_ID 变量在脚本中正确使用。Job Arrays 会创建大量的独立作业，可能会对 SLURM 调度器造成压力。

总结

本文介绍了两种在 SLURM 环境下并行执行 Python 脚本的方法：使用 srun 命令和使用 Job Arrays。srun 命令提供了更灵活的控制，可以手动分配任务到不同的节点。Job Arrays 则更加简洁，方便管理大量的相似任务。选择哪种方法取决于具体的应用场景和需求。理解 SLURM 的工作原理和正确配置 SLURM 脚本是充分利用集群资源的关键。记住要根据集群的具体配置和任务需求，调整 SLURM 脚本中的参数，以获得最佳的性能。

以上就是SLURM 并行执行：在多个文件上运行相同的 Python 脚本的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/630381.html

ai node python 环境变量

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

284.1K 文章

0 评论

1 粉丝

这个人很懒，什么都没有留下～

SLURM 并行处理：在多个文件上运行相同的脚本

上一篇 2025年11月11日 10:51:39

Taipy file_selector 组件的文件处理机制与常见问题解析

下一篇 2025年11月11日 10:55:45

好文分享

以太坊分数据怎么看？以太坊分数据分析软件汇总

%ignore_a_1%币安交易所 Binance币安注册入口： Binance币安APP下载：欧易OKX交易所欧易(OKX)注册入口：欧易(OKX)注册APP下载：火币HTX交易所：注册入口： APP下载：想要深入了解以太坊网络的运行状态，掌握链上数据的分析方法至关重要。本文将为您汇总…

程序猿
2025年12月9日
0000
好文分享

Web3+AI浏览器项目Donut Labs完成1500万美元种子轮融资

Web3+AI 浏览器项目 Donut Labs 宣布完成约 1500万美元种子轮融资。该项目致力于将人工智能与去中心化网络结合，打造下一代智能浏览体验，并为 Web3 应用提供更便捷的入口。 Donut Labs 项目亮点该项目通过集成 AI 技术和去中心化功能，实现以下优势：智能搜索与推荐…

程序猿
2025年12月9日
0000
好文分享

BNB Chain正式发布Fermi硬分叉，区块间隔缩短至450毫秒

BNB Chain近日正式发布了 Fermi硬分叉升级，本次升级将区块间隔时间缩短至 450毫秒，旨在提升网络交易吞吐量和整体效率。这一升级对于去中心化应用及交易所交易速度具有重要意义。 Fermi硬分叉的核心改进此次硬分叉主要带来以下变化：区块生成加速：从原有间隔缩短至450毫秒，提高交易确…

程序猿
2025年12月9日
0000
好文分享

Cosmos生态2.0：详解ATOM代币通缩与链间安全将带来哪些变化？

cosmos生态迎来重大升级，其核心是atom代币经济模型的彻底革新。新的通缩机制与链间安全的引入，将重塑atom的价值捕获能力，并为整个生态系统注入新的活力与增长动力。 ATOM代币的新经济模型与通缩机制 1、旧有的经济模型主要依赖固定的通货膨胀来支付质押奖励，而Cosmos 2.0提出的新方案将…

程序猿
2025年12月9日
0000
好文分享

全方位教学指南：如何寻找下一个百倍币？

binance币安交易所注册入口： APP下载：欧易OKX交易所注册入口： APP下载：火币交易所：注册入口： APP下载：寻找百倍币是每位加密投资者的梦想，但这并非易事，需要敏锐的洞察力、严谨的研究和一点运气。本指南将从多个维度出发，为你提供一套系统性的方法论，助你在这场高风险高回报的…

程序猿
2025年12月9日
0000
好文分享

盘点币圈VC的投资版图：A16Z、Paradigm在2025年重点布局了哪些赛道？

进入2025年，加密市场风起云涌，顶级vc巨头a16z和paradigm的布局动向，无疑是预示行业未来的关键风向标。它们正以前瞻性的眼光，在多个前沿赛道上落子，试图捕捉下一个周期的大规模增长机会。 A16Z：押注大规模应用与AI融合 1、模块化区块链与基础设施。A16Z持续看好能够提升可扩展性和定制…

程序猿
2025年12月9日
0000
好文分享

哪个DEX交易最划算？Uniswap、Sushiswap、Curve滑点与费用对比

在众多去中心化交易所（dex）中选择最划算的一个并非易事。交易成本主要由手续费和滑点决定，本文将重点对比uniswap、sushiswap和curve这三大平台的优劣。 Uniswap的特点与费用 1、作为DEX领域的绝对龙头，Uniswap拥有最深厚的流动性池和最高的交易量，这通常意味着对于主流币…

程序猿
2025年12月9日
0000
好文分享

Chainlink(LINK)价格预测：CCIP协议能否助其在2025年重回巅峰？

chainlink作为预言机赛道的绝对领导者，其价格走势一直备受市场关注。随着其跨链互操作协议ccip的正式上线，许多投资者认为这可能是推动link在2025年重回甚至超越历史巅峰的关键催化剂。 CCIP协议的核心价值与潜力 1、CCIP协议旨在成为区块链世界的“TCP/IP”，它提供了一个通用且高…

程序猿
2025年12月9日
0000
好文分享

比特币到底是什么大白话版_零基础也能听懂的比特币科普

你是不是经常在新闻里、朋友口中听到“比特币”这三个字，感觉它又神秘又高大上，像是个遥不可及的金融密码？别担心，今天咱们就用最接地气的大白话，把比特币这个东西说明白，保证零基础的你也能听懂。 2025其他主流比特币交易所：欧易：币安：火币：把比特币想象成一个“全球公开大账本” 忘掉那些…

程序猿
2025年12月9日
0000
好文分享

比特币最简单易懂的解说_一分钟快速了解比特币是什么

比特币到底是个啥？简单来说，比特币就是一种数字形式的钱。就像你账户里的美元一样，但它没有实体，只存在于互联网上。你可以把它看作是“互联网黄金”或是一种全球通用的网络货币。 2025其他主流比特币交易所：欧易：币安：火币：它最大的特点就是：去中心化。这是什么意思呢？我们平时用的钱，…

程序猿
2025年12月9日
0000
好文分享

比特币新手必知必会知识_通俗类比讲透比特币运作

比特币新手必知必会知识：通俗类比讲透比特币运作比特币，一个在新闻和网络上频繁出现的词汇，听起来既神秘又高科技。很多人一听到“区块链”、“加密”、“挖k”这些词就头大。但其实，比特币的核心运作原理，完全可以通过我们生活中常见的例子来轻松理解。本文将用最通俗的类比，为你彻底讲明白比特币到底是怎么一回事…

程序猿
2025年12月9日
0000
好文分享

比特币超简单入门教程_从零开始认识数字货币

比特币超简单入门教程你可能或多或少听说过比特币（bitcoin），也许是从新闻里，也许是从朋友口中。它听起来既神秘又复杂，充满了技术术语，让人望而却步。但别担心，这篇文章将用最简单直白的方式，带你从零开始，一步步揭开比特币和数字货币的神秘面纱。首先，忘掉那些复杂的代码和算法。让我们从一个简单的比…

程序猿
2025年12月9日
0000
好文分享

揭秘加密货币量化交易平台：Pionex(派网) 8大交易机器人实测

pionex(派网)作为一个专为量化交易设计的加密货币平台，内建了超过16种免费交易机器人。它旨在简化复杂的交易策略，让普通投资者也能轻松使用程序化工具进行自动化套利，享受科技带来的交易便利。 Pionex平台核心优势 1、内建极其丰富的免费交易机器人，从网格交易到马丁格尔，无需用户掌握编程知识，只…

程序猿
2025年12月9日
0000
好文分享

比特币核心概念通俗解读_一次性讲透比特币的本质

比特币核心概念通俗解读_一次性讲透比特%ignore_a_2%的本质很多人都听说过比特币，它时而暴涨，时而暴跌，充满了神秘色彩。但比特币到底是什么？它又是如何运作的？这篇文章将用最通俗易懂的语言，帮你一次性理解比特币的核心本质，即使你没有任何技术背景，也能轻松看懂。 2025其他主流比特币交易所：…

程序猿
2025年12月9日
0000
好文分享

ASTER 支持交易所盘点：Binance Futures、Hyperliquid等，暴跌后最佳交易对

aster代币在经历早期剧烈波动后，目前主要在少数几家支持其永续合约和现货交易的平台上流通。选择合适的交易对和平台，对管理风险和捕捉机会至关重要。 Binance币安欧易OKX ️ Huobi火币️ 支持ASTER交易的主要平台目前，直接提供ASTER/USDT或类似交易对的中心化和去中心化交易…

程序猿
2025年12月9日
0000
好文分享

JELLYJELLY 是什么币？Solana视频分享meme的社交革命，一天暴涨203%的秘密

jellyjelly（jelly-my-jelly）是一种基于solana区块链的meme币，但它不仅仅是一个网络迷因。它背后结合了强大的技术背景与社交应用愿景，正试图将加密货币从单纯的投机工具转变为可实际使用的社交资产。其在2025年初上线后曾创下一天暴涨超过200%的惊人表现，吸引了大量市场关注…

程序猿
2025年12月9日
0000
好文分享

GIGGLE 详解：BSC meme慈善币的起源，CZ澄清后为何从天堂坠落地狱？

giggle 这个代币的故事，核心其实是市场情绪、名人效应和项目方澄清之间的一场拉锯战。它并非由官方发起，却因与币安创始人 cz 的紧密关联而一飞冲天，最终又因为官方的“不认领”声明而失去叙事支撑，价格大幅回落。 Binance币安欧易OKX ️ Huobi火币️ 起源：CZ 的慈善信号点燃 BS…

程序猿
2025年12月9日
0000
好文分享

ASTER 是什么？多链ZK隐私DEX的永续合约王者，揭秘暴跌背后的Layer-1生态

aster不是一个单一的layer-1区块链，而是一个创新的多链去中心化永续合约平台。它之所以引起巨大关注，并非因为它自己是“永续合约王者”，而是因为它采用了独特的聚合策略和前沿技术来解决现有痛点。 Binance币安欧易OKX ️ Huobi火币️ 核心定位：多链聚合与隐私交易 ASTER的核心…

程序猿
2025年12月9日
0000
好文分享

ASTER 杠杆交易入门：从KuCoin注册到多链桥接，一步步避开清算坑

想玩转aster的高杠杆交易，光盯着1001倍的宣传可不行。这玩意儿是把双刃剑，用不好分分钟被市场清理出局。核心在于搞懂规则、管好风险，再配合顺畅的资金通道。从注册kucoin开始到最终在aster上安全交易，每一步都得踩稳了。 Binance币安欧易OKX ️ Huobi火币️ 注册与入金：打通…

程序猿
2025年12月9日
0000
好文分享

除了比特币和以太坊，新手还应该了解哪五种加密货币？

在加密货币的广阔天地里，比特币与以太坊无疑是两座无法绕开的巨峰。但对于初学者而言，仅仅了解它们是远远不够的。探索其他具有创新技术和特定应用场景的项目，是构建全面认知和多元化视野的关键一步。这些项目或许在交易速度、成本效益或应用领域上提供了不同的解决方案，共同构成了丰富多彩的加密生态。高性能平台与以…

程序猿
2025年12月9日
0000