如何分割Linux大文件传输 split文件切割与合并

程序猿 • 2025年11月7日 15:46:06 • 运维 • 阅读 0

使用split命令将大文件按指定大小分割成多个小文件，便于传输；2. 传输分割后的文件及校验和文件到目标机器；3. 使用cat命令按正确顺序合并文件；4. 通过md5sum等校验工具验证合并后文件的完整性，确保数据无损。该方法有效规避文件系统限制、网络不稳定等问题，提升大文件传输的可靠性与效率。

处理Linux上的大文件传输，特别是当文件大小超出文件系统限制、网络稳定性堪忧或传输工具不给力时，确实是个令人头疼的问题。解决方案其实很直接：使用

split

命令将大文件分割成若干小块，传输完成后再用

cat

命令将它们合并起来。这不仅能规避许多潜在的传输风险，也能让整个过程变得可控和安心。

解决方案

分割大文件主要依靠

split

命令。它的核心思想是把一个输入文件拆分成多个输出文件，每个输出文件的大小或行数可以自定义。

最常用的方式是按大小分割：

split -b 1G large_archive.tar.gz archive_part_

这条命令会将

large_archive.tar.gz

文件分割成多个1GB大小的文件。

archive_part_

是分割后文件的前缀，例如会生成

archive_part_aa

archive_part_ab

archive_part_ac

等。

如果你想让分割后的文件名带有数字后缀，可以使用

-d

参数，并配合

-a

指定后缀的长度：

split -b 500M -d -a 3 my_big_data.sql data_part_

这会生成

data_part_000

data_part_001

data_part_002

等，每个文件500MB。选择多大的块，通常取决于你的网络带宽、接收方的存储能力以及你对传输中断的容忍度。我个人习惯是1GB或者500MB，感觉这个大小在大多数网络环境下都比较稳妥。

分割完成后，传输这些小文件就容易多了，无论是通过SCP、FTP还是其他方式。

当所有分割文件都传输到目标机器后，合并它们就简单了，使用

cat

命令：

cat archive_part_* > large_archive.tar.gz

这里的关键是

archive_part_*

，它会按照字母顺序（或数字顺序，如果你用了

-d

）将所有匹配的文件连接起来，然后重定向到一个新的文件

large_archive.tar.gz

。顺序千万不能错，不然合并出来的文件就是损坏的。

split

命令默认的命名方式（

aa

ab

或

）正好确保了

cat *

能够正确地按序合并。

为什么我们需要分割大文件？

有时候，你可能会觉得直接传输一个大文件不是更省事吗？但现实往往没那么理想。我个人就遇到过好几次，眼看着一个几十GB的文件通过网络传到99%突然断了，那种挫败感真是难以言喻。分割文件能规避很多这类问题，主要有以下几个原因：

文件系统限制： 某些旧的文件系统，比如FAT32，对单个文件的大小有限制（通常是4GB）。如果你需要把一个超过4GB的文件拷贝到这种格式的U盘或移动硬盘上，不分割根本就放不进去。网络传输稳定性： 大文件传输时间长，网络波动、瞬时断线、服务器过载等任何一个环节出问题，都可能导致整个传输失败。分割成小文件后，即使某个小文件传输失败，也只需要重传那一部分，而不是从头再来，心理负担都小很多。传输工具兼容性： 某些SCP、FTP客户端或Web上传界面在处理超大文件时可能会出现内存溢出、连接超时或效率低下的问题。分割后，每个文件都在工具的舒适区内，传输会更顺畅。存储与处理便利性： 接收方可能没有足够的连续磁盘空间一次性接收一个超大文件，或者他们需要分批处理这些数据。分割后，接收方可以边接收边处理，或者选择性地下载部分数据。带宽效率： 虽然

split

本身不提供并行传输，但分割后你可以手动或通过脚本同时传输多个小块，在某些情况下可以提高整体传输效率。

如何确保文件分割与合并的完整性？

仅仅分割和合并是不够的，你还需要确保合并后的文件和原始文件是完全一致的，没有在传输或合并过程中损坏。这是数据完整性的核心，也是我每次操作大文件都必不可少的一步。

最可靠的方法是使用校验和（Checksums）。Linux提供了

md5sum

、

sha1sum

、

sha256sum

等工具来生成文件的数字指纹。

文心大模型

百度飞桨-文心大模型 ERNIE 3.0 文本理解与创作

56 查看详情

基本流程是这样的：

在源机器上，分割文件前，计算原始文件的校验和：

md5sum original_large_file.iso > original_large_file.iso.md5

这会生成一个

.md5

文件，里面包含了原始文件的MD5值。这个MD5文件很小，可以和分割后的文件一起传输过去。

传输所有分割后的文件和校验和文件到目标机器。在目标机器上，合并所有文件：

cat part_aa part_ab part_ac > merged_large_file.iso

确保合并后的文件名和原始文件名一致（或者你方便记忆）。

计算合并后文件的校验和，并与原始校验和进行比对：

md5sum -c original_large_file.iso.md5

如果输出显示

original_large_file.iso: OK

，那么恭喜你，文件完整无损。如果显示

MISMATCH

，那就说明文件在传输或合并过程中出了问题，需要重新检查或传输。

除了校验和，你也可以进行一个初步的检查：比较原始文件和合并后文件的大小。虽然文件大小一致不代表内容一定正确，但如果大小不一致，那肯定就是出错了。

ls -lh

命令可以方便地查看文件大小。

我个人通常会先用

md5sum

生成个校验文件，传过去之后再跑一次比对。如果对不上，那肯定哪里出了问题，可能网络不稳定导致某个小块损坏，也可能是合并命令哪里写错了。这种主动的检查比事后发现文件损坏要省心多了，毕竟谁也不想等到用的时候才发现文件打不开。

自动化分割与合并的脚本实践

手动执行

split

和

cat

命令，尤其是在文件多或者需要频繁操作时，效率并不高，而且容易出错。这时候，编写简单的Shell脚本就能大大提升效率和可靠性。写脚本的好处是，下次再遇到类似情况，直接跑一下就行，不用记那些复杂的参数，而且还能把校验过程也集成进去，省心。

一个简单的分割脚本示例：

#!/bin/bash# file_splitter.sh# 用法: ./file_splitter.sh   [输出文件前缀]# 检查参数数量if [ "$#" -lt 2 ]; then    echo "用法: $0   [输出文件前缀]"    echo "示例: $0 my_big_video.mp4 1024 video_part_"    exit 1fiINPUT_FILE="$1"CHUNK_SIZE_MB="$2"# 如果没有提供前缀，就使用输入文件名（去除扩展名）作为默认前缀OUTPUT_PREFIX="${3:-$(basename "$INPUT_FILE" .${INPUT_FILE##*.})}.part"# 检查输入文件是否存在if [ ! -f "$INPUT_FILE" ]; then    echo "错误: 输入文件 '$INPUT_FILE' 未找到。"    exit 1fiecho "正在分割 '$INPUT_FILE' 为 ${CHUNK_SIZE_MB}MB 的块..."# 使用-d -a 3确保数字后缀，方便排序和识别split -b "${CHUNK_SIZE_MB}M" -d -a 3 "$INPUT_FILE" "$OUTPUT_PREFIX"echo "正在为原始文件生成MD5校验和..."md5sum "$INPUT_FILE" > "${INPUT_FILE}.md5"echo "分割完成。文件块前缀为 '$OUTPUT_PREFIX'。"echo "MD5校验和已保存到 '${INPUT_FILE}.md5'。"

这个脚本自动化了分割过程，并自动生成MD5校验和文件。

一个简单的合并脚本示例：

#!/bin/bash# file_merger.sh# 用法: ./file_merger.sh   [MD5校验和文件]# 检查参数数量if [ "$#" -lt 2 ]; then    echo "用法: $0   [MD5校验和文件]"    echo "示例: $0 my_big_video.mp4 video_part_ my_big_video.mp4.md5"    exit 1fiOUTPUT_FILE="$1"PARTS_PREFIX="$2"MD5_CHECKSUM_FILE="$3"echo "正在合并前缀为 '$PARTS_PREFIX' 的文件块到 '$OUTPUT_FILE'..."# 使用排序后的通配符确保正确顺序cat "${PARTS_PREFIX}"* > "$OUTPUT_FILE"echo "正在验证文件完整性..."if [ -f "$MD5_CHECKSUM_FILE" ]; then    if md5sum -c "$MD5_CHECKSUM_FILE" --status; then        echo "MD5校验和匹配。文件完整性已验证。"    else        echo "MD5校验和不匹配！文件可能已损坏。"    fielse    echo "未提供或未找到MD5校验和文件。跳过完整性检查。"fiecho "合并完成。"

这个合并脚本不仅将文件合并，还尝试使用提供的MD5校验和文件进行完整性验证。

使用这些脚本，你只需要提供几个简单的参数，剩下的工作就交给系统去完成。这不仅减少了手动输入命令的错误，也让整个大文件传输和处理流程变得更加专业和高效。尤其是在需要定期处理大文件备份或同步的场景下，这些小脚本能省去不少麻烦。

以上就是如何分割Linux大文件传输 split文件切割与合并的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/435105.html

linux shell脚本为什么工具文件备份

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

如何在Linux中查看命令历史 Linux history命令使用技巧

上一篇 2025年11月7日 15:45:27

Linux如何查看服务当前的状态

下一篇 2025年11月7日 15:46:23

好文分享

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
9000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 好文分享
4000
好文分享

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
0000
好文分享

为什么我的特定 DIV 在 Edge 浏览器中无法显示？

特定 DIV 无法显示：用户代理样式表的困扰当你在 Edge 浏览器中打开项目中的某个 div 时，却发现它无法正常显示，仔细检查样式后，发现是由用户代理样式表中的 display none 引起的。但你疑问的是，为什么会出现这样的样式表，而且只针对特定的 div？背后的原因用户代理样式表是由…

程序猿
2025年12月24日
2000
好文分享

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
0000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

为什么使用 inline-block 元素时会错位？

inline-block 元素错位成因剖析在使用 inline-block 元素时，可能会遇到它们错位显示的问题。如代码 demo 所示，当设置了 overflow 属性时，a 标签就会错位下沉，而未设置时却不会。问题根源： overflow:hidden 属性影响了 inline-block …

程序猿
2025年12月24日
0000
好文分享

为什么我的 CSS 元素放大效果无法正常生效？

css 设置元素放大效果的疑问解答原提问者在尝试给元素添加 10em 字体大小和过渡效果后，未能在进入页面时看到放大效果。探究发现，原提问者将 CSS 代码直接写在页面中，导致放大效果无法触发。解决办法如下：将 CSS 样式写在一个单独的文件中，并使用标签引入该样式文件。这个操作与原提问者观…

程序猿
2025年12月24日
0000
好文分享

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
1000
好文分享

为什么在父元素为inline或inline-block时，子元素设置width: 100%会出现不同的显示效果？

width:100%在父元素为inline或inline-block下的显示问题问题提出当父元素为inline或inline-block时，内部元素设置width:100%会出现不同的显示效果。以代码为例：测试内容这是inline-block span 效果1：父元素为inline-bloc…

程序猿
2025年12月24日
4000
好文分享

如何在 VS Code 中解决折叠代码复制问题？

解决 VS Code 折叠代码复制问题在 VS Code 中使用折叠功能可以帮助组织长代码，但使用复制功能时，可能会遇到只复制可见部分的问题。以下是如何解决此问题：当代码被折叠时，可以使用以下简单操作复制整个折叠代码：按下 Ctrl + C (Windows/Linux) 或 Cmd + C …

程序猿
2025年12月24日
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
0000
好文分享

响应式HTML5按钮适配不同屏幕方法【方法】

实现响应式HTML5按钮需五种方法：一、CSS媒体查询按max-width断点调整样式；二、用rem/vw等相对单位替代px；三、Flexbox控制容器与按钮伸缩；四、CSS变量配合requestAnimationFrame优化的JS动态适配；五、Tailwind等框架的响应式工具类。如果您希望H…

程序猿
2025年12月23日
0000
好文分享

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
3000
好文分享

html5游戏怎么修改_HT5改JS逻辑或资源文件调整游戏玩法效果【修改】

需直接编辑核心JavaScript代码或替换图片、音频等资源文件；先用浏览器开发者工具的Sources面板定位含game、main等关键词的.js文件，再搜索score++、if (health等逻辑片段进行修改。如果您下载了某个HTML5游戏的本地文件，希望调整其玩法逻辑或替换资源以改变视觉效果…

程序猿
2025年12月23日
0000
好文分享

html5怎么重叠图片_html5用position:absolute或z-index让图片重叠【重叠】

在HTML5中实现图片重叠需结合CSS定位与层叠控制：一、用position:absolute+top/left精确定位，父容器设position:relative；二、用z-index设定堆叠顺序（需已定位）；三、用transform:translate()实现无文档流干扰的偏移重叠；四、用CSS…

程序猿
2025年12月23日
2000
好文分享

html5如何建立站点_HTML5站点建立步骤与网站搭建技巧【指南】

HTML5网站搭建需五步：一、建my-website目录及css/js/images子目录，含index.html；二、写标准HTML5骨架，含DOCTYPE、lang、meta、语义化标签；三、外链CSS与defer/async脚本；四、用http-server启本地服务；五、用email/num…

程序猿
2025年12月23日
0000
好文分享

html5怎么设置黑体_html5用CSS font-family设黑体或font-weight加粗【设置】

在HTML5中实现黑体及加粗需用CSS的font-family和font-weight：一、font-family按优先级列“SimHei”,“Microsoft YaHei”,“Heiti SC”,sans-serif；二、font-weight用700或bold；三、组合声明并注意继承；四、可用…

程序猿
2025年12月23日
0000
好文分享

html5怎么去除黑点_html5用list-style:none去除ul/ol列表黑点【去除】

可通过 CSS 的 list-style 属性隐藏列表标记：一、list-style: none 最常用；二、list-style-type: none 精准移除符号；三、重置 list-style 全部子属性应对样式干扰；四、display: inline-block 配合 list-style:…

程序猿
2025年12月23日
0000