Python 二进制文件的读取与写入

Python中读写二进制文件需用’rb’或’wb’等带’b’的模式,配合bytes类型操作,读取时返回bytes对象,可分块处理大文件,写入时需确保数据为bytes类型,避免编码错误,注意文件会被覆盖或追加。

python 二进制文件的读取与写入

Python 中读取和写入二进制文件非常直接,关键在于使用正确的模式打开文件,并配合 bytes 类型进行操作。二进制文件包括图片、音频、视频、可执行文件等非文本数据,不能用普通文本方式处理。

打开二进制文件的模式

在使用 open() 函数时,通过添加 ‘b’ 标志来指定以二进制模式操作:

‘rb’:以二进制格式读取文件’wb’:以二进制格式写入文件(会覆盖原有内容)’ab’:以二进制格式追加写入’r+b’:以二进制格式读写

读取二进制文件

使用 ‘rb’ 模式打开文件后,调用 read() 方法获取字节内容:

with open('example.jpg', 'rb') as f:    data = f.read()    print(type(data))  # 

也可以分块读取,避免大文件占用过多内存:

立即学习“Python免费学习笔记(深入)”;

chunk_size = 1024with open('large_file.bin', 'rb') as f:    while chunk := f.read(chunk_size):        process(chunk)  # 处理每一块数据

写入二进制文件

要将 bytes 写入文件,使用 ‘wb’ 模式。注意如果文件已存在会被覆盖:

binary_data = b'x48x65x6cx6cx6f'  # bytes 对象with open('output.bin', 'wb') as f:    f.write(binary_data)

若需追加内容,改用 ‘ab’ 模式即可:

with open('output.bin', 'ab') as f:    f.write(b'x20x57x6fx72x6cx64')  # 追加 " World"

常见注意事项

处理二进制数据时要注意以下几点:

必须使用 bytes 或 bytearray 类型进行写入,字符串需先编码不要在二进制模式下使用文本相关参数如 encoding读取结果是不可变的 bytes,如需修改可用 bytearray某些文件格式有特定结构(如 PNG 头部),写入时需遵循规范

基本上就这些。只要记住用 ‘b’ 模式并操作 bytes 类型,就能正确处理各类二进制文件。不复杂但容易忽略细节。

以上就是Python 二进制文件的读取与写入的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1381621.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 23:07:04
下一篇 2025年12月14日 23:07:14

相关推荐

  • Python 异常链 Exception chaining 的概念

    异常链用于在抛出新异常时保留原始异常信息,帮助追踪错误根源。Python支持隐式和显式两种异常链:隐式链自动将except块中引发的新异常关联到当前异常,通过raise…from…可显式指定原因;使用raise…from None则可清除原异常信息。例如打开文件失…

    好文分享 2025年12月14日
    000
  • python模块引入的三种方式

    import模块名可避免命名冲突,需用模块前缀访问;2. from模块名import成员可直接使用指定功能,适用于少量函数;3. from模块名import*易引发命名冲突,降低可读性,不推荐使用。 在Python中,模块引入主要有三种方式,每种方式适用于不同的场景,理解它们的区别有助于写出更清晰、…

    2025年12月14日
    000
  • python中remove()方法如何使用删除后的值?

    要获取被删除的值,需用index()和pop()组合:先通过index()找到值的索引,再用pop()删除并返回该值。示例:my_list = [10, 20, 30, 40]; value_to_remove = 30; try: index = my_list.index(value_to_re…

    2025年12月14日
    000
  • Python 文件数据缓存与内存映射 mmap

    答案:处理大文件时,小文件高频读取用内存缓存,大文件随机访问用mmap。缓存减少重复I/O,适合中小文件;mmap映射文件到内存,按需加载,支持随机读写和跨进程共享,适用于大文件处理。 处理大文件时,直接读取可能消耗大量内存和时间。Python 提供了多种方式优化文件数据访问,其中 数据缓存 和 m…

    2025年12月14日
    000
  • defaultdict在python中接收调用对象

    答案:defaultdict通过传入可调用对象为不存在的键生成默认值,如list、int、lambda等,访问缺失键时自动调用该对象创建值,常用于分组、计数等场景。 在 Python 中,defaultdict 来自 collections 模块,它的特点是在访问不存在的键时,会自动创建一个默认值。…

    2025年12月14日
    000
  • 在TensorFlow中本地加载.npz格式数据集的实用指南

    当tensorflow内置数据集加载功能因网络限制而失败时,本文提供了一种高效且可靠的替代方案。我们将详细介绍如何手动下载`.npz`格式的数据集(如mnist),并利用numpy库将其直接加载到python环境中,从而避免网络连接问题,确保机器学习项目的顺利进行。 在进行机器学习项目时,我们经常需…

    2025年12月14日
    000
  • Python编程中解决IndexError:优化最长公共前缀算法

    本教程深入探讨python中最长公共前缀算法常见的`indexerror: string index out of range`运行时错误。文章分析了错误发生的根本原因——未正确选择参考字符串进行字符比较和长度迭代,并提出通过选取最短字符串作为参考的优化方案。通过详细的代码示例和逻辑解析,帮助开发者…

    2025年12月14日
    000
  • PLY Lexer规则定义最佳实践:Token返回与优先级管理

    本文深入探讨python ply库在构建词法分析器时常见的两个关键问题:token规则函数未正确返回token对象,以及token规则之间的优先级冲突。通过详细分析`pass`语句的误用和通用规则对特定规则的遮蔽效应,文章提供了两种有效的解决方案,包括在通用规则中内联处理特定关键字和调整规则定义顺序…

    2025年12月14日
    000
  • IntelliJ IDEA文件类型识别与管理:从.txt到.py的转换与配置

    本文深入探讨intellij idea如何识别文件类型,主要通过文件名或shebang行。针对用户误创建`.txt`文件而非`.py`文件的情况,教程详细介绍了两种解决方案:一是通过右键菜单临时覆盖单个文件的类型,将其指定为python脚本;二是通过“偏好设置”中的“文件类型”功能进行全局配置和管理…

    2025年12月14日
    000
  • 在 Behave 测试中利用 Fixture 自动化临时目录创建与清理

    本文详细介绍了如何在 python 的 behave 行为驱动开发框架中,利用其强大的 fixture 机制来创建和管理临时目录。通过定义一个自定义 fixture 并结合 `before_tag` 钩子,我们能够为特定场景(scenario)或特性(feature)提供一个隔离的临时工作目录,确保…

    2025年12月14日
    000
  • 解决Outlook邮件中CID引用嵌入图片显示异常:VML格式干扰及解决方案

    本文旨在解决使用python通过`win32com.client`库向outlook邮件中嵌入图片时,cid引用无法正常显示的问题。尽管已正确设置cid属性并修改了html `src`引用,图片仍显示为破损。核心原因在于html内容中存在的vml(vector markup language)格式与…

    好文分享 2025年12月14日
    000
  • Python subprocess模块实现外部进程的非阻塞I/O与控制

    本文探讨了在python中使用`subprocess`模块与外部进程进行交互时,如何克服阻塞i/o的挑战,实现非阻塞的标准输出和错误流捕获。通过结合线程和队列,我们展示了一种解决方案,能够预先提供输入,并在进程运行或超时后高效收集其所有输出,同时指出其在完全实时交互式控制方面的局限性。 在Pytho…

    2025年12月14日
    000
  • 优化HDFS数据访问:利用短路本地读取提升性能

    本文探讨了在hdfs环境中,如何通过利用数据本地性来显著减少网络传输,从而优化数据访问性能。针对用户在使用fsspec等工具读取hdfs数据时遇到的高网络流量问题,文章重点介绍了hdfs的短路本地读取(short circuit local reads)机制。通过详细阐述其原理、配置方法以及潜在的优…

    2025年12月14日
    000
  • Python列表交集:二分查找实现与常见错误解析

    本文围绕使用二分查找算法求解两个列表交集时可能遇到的`typeerror`和逻辑问题展开。文章将深入剖析`list.pop()`方法的正确用法、二分查找算法的先决条件(即列表必须有序)、如何有效进行结果去重以及在多轮查找中搜索范围的重置机制。此外,文章还将提供一个经过修正的二分查找实现示例,并介绍一…

    2025年12月14日
    000
  • 使用Python在Windows上自动化显示器屏幕旋转

    本教程旨在解决Windows用户手动调整显示器方向的繁琐问题。通过结合Python的`subprocess`模块与第三方工具`Display64.exe`,本文将详细指导您如何编写脚本,实现显示器屏幕方向的自动化切换,提升操作效率。内容涵盖工具获取、代码实现及参数解析,助您轻松定制显示器显示模式。 …

    2025年12月14日
    000
  • Python Turtle:精确绘制半跨Y轴垂直椭圆教程

    本教程详细介绍了如何使用python的`turtle`模块绘制一个特定的垂直椭圆。我们将学习如何通过调整海龟的初始位置和方向,并利用不同半径的圆弧组合,实现椭圆的半跨y轴居中效果,并提供可运行的代码示例,帮助读者掌握绘制这类复杂图形的技巧。 在使用Python的turtle模块进行图形编程时,绘制标…

    2025年12月14日
    000
  • Python临时文件操作:解决文件占用与复制难题

    在使用python处理临时文件时,开发者常遇到文件被占用或在关闭后立即删除的问题,尤其当需要对临时文件执行复制等外部操作时。本文将深入探讨`tempfile`模块中`temporaryfile`和`namedtemporaryfile`的区别,并提供使用`namedtemporaryfile`配合`…

    2025年12月14日
    000
  • Tkinter与Matplotlib:在独立窗口中显示实时动态图表的教程

    本文详细阐述了如何在tkinter应用程序中,通过按钮操作在一个独立的子窗口中展示实时更新的matplotlib动态图表。教程重点解决了在gui编程中常见的frame容器创建不当、子窗口类型选择(tk vs toplevel)以及matplotlib动画funcanimation对象生命周期管理等问…

    2025年12月14日
    000
  • 直接访问数组排序:基于键实现对象排序的机制与实践

    直接访问数组排序是一种利用键作为数组索引的线性时间排序算法。它通过构建一个辅助数组,将原始数据项(包含键和值)直接存储在与其键对应的位置。随后,按键的自然顺序遍历辅助数组,即可高效地提取出完整的、已排序的数据项,从而实现对“值”而非仅仅“键”的排序,但要求键为不重复的非负整数。 什么是直接访问数组排…

    2025年12月14日
    000
  • Pandas DataFrame中多列组合条件计数:避免常见错误与高效实践

    本教程详细讲解如何在pandas dataframe中根据多个列的组合条件进行精确计数。文章重点阐述了在使用`loc`进行多条件筛选时,通过正确使用括号来明确布尔运算符优先级的重要性,从而避免常见的“ambiguous”错误,并提供清晰的代码示例,帮助用户高效统计特定数据组合的数量。 引言:Pand…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信