python如何读取一个txt文件_python读写TXT文件的基本操作

程序猿 • 2025年12月14日 12:51:17 • 用户投稿 • 阅读 0

Python读写TXT文件需用open()函数配合with语句确保安全，读取可用read()、readline()或readlines()，写入用write()或writelines()，并指定编码防乱码。

Python读取TXT文件，核心在于使用内置的

open()

函数来打开文件，然后根据需求选择不同的方法（如

read()

、

readline()

或

readlines()

）来获取文件内容。写入文件也同样通过

open()

函数，并利用

write()

或

writelines()

方法实现。重要的是，始终推荐使用

with

语句来管理文件操作，这能确保文件在操作完成后被正确关闭，即使发生错误也不例外。

解决方案

处理TXT文件，无论是读还是写，其基本骨架都围绕着Python的

open()

函数展开。这个函数返回一个文件对象，我们通过它来与文件交互。

读取TXT文件：

最常见的场景就是把文件内容读出来。这里有几种方式，取决于你希望如何处理文件内容。

立即学习“Python免费学习笔记（深入）”；

一次性读取整个文件：如果你确定文件不大，或者需要一次性处理所有内容，

read()

方法最直接。

try:    with open('my_document.txt', 'r', encoding='utf-8') as file:        content = file.read()        print("文件全部内容：")        print(content)except FileNotFoundError:    print("错误：文件 'my_document.txt' 未找到。")except UnicodeDecodeError:    print("错误：文件编码不匹配，尝试其他编码。")

这里

'r'

表示读取模式，

encoding='utf-8'

则指定了文件编码，这是非常关键的一步，不然很容易遇到乱码问题。

逐行读取文件：对于大多数文本文件处理，逐行读取更为常见，也更节省内存，尤其是在处理大文件时。

try:    with open('my_document.txt', 'r', encoding='utf-8') as file:        print("n逐行读取内容：")        for line_num, line in enumerate(file, 1):            print(f"第 {line_num} 行: {line.strip()}") # .strip() 去除行尾的换行符except FileNotFoundError:    print("错误：文件 'my_document.txt' 未找到。")except UnicodeDecodeError:    print("错误：文件编码不匹配，尝试其他编码。")

直接迭代文件对象是最优雅且高效的逐行读取方式。

读取所有行到一个列表中：如果你需要将文件的所有行作为一个列表来处理，

readlines()

方法会很方便。

try:    with open('my_document.txt', 'r', encoding='utf-8') as file:        lines = file.readlines()        print("n所有行以列表形式：")        for line_num, line in enumerate(lines, 1):            print(f"列表第 {line_num} 项: {line.strip()}")except FileNotFoundError:    print("错误：文件 'my_document.txt' 未找到。")except UnicodeDecodeError:    print("错误：文件编码不匹配，尝试其他编码。")

注意，

readlines()

会把所有行加载到内存中，对超大文件要慎用。

写入TXT文件：

写入文件同样需要选择合适的模式。

写入新内容（覆盖模式）：使用

'w'

模式会创建一个新文件，如果文件已存在，则会清空原有内容。

new_content = "这是我写入的第一行内容。n这是第二行，带换行符。n"with open('output.txt', 'w', encoding='utf-8') as file:    file.write(new_content)    file.write("再加一行，不带换行符可能和上一行连起来。n")print("n'output.txt' 已在'w'模式下写入。")

追加内容（追加模式）：使用

'a'

模式会在文件末尾添加新内容，而不会覆盖原有内容。如果文件不存在，则会创建新文件。

append_content = "这是追加的新内容。n"with open('output.txt', 'a', encoding='utf-8') as file:    file.write(append_content)print("n'output.txt' 已在'a'模式下追加内容。")

写入多行内容：

writelines()

方法可以写入一个字符串列表。

list_of_lines = ["列表中的第一行。n", "列表中的第二行。n", "列表中的第三行。n"]with open('output_list.txt', 'w', encoding='utf-8') as file:    file.writelines(list_of_lines)print("n'output_list.txt' 已使用writelines写入。")

需要注意的是，

writelines()

不会自动添加换行符，你需要确保列表中的每个字符串都包含

。

处理文件编码问题：为什么我的TXT文件读出来是乱码？

这几乎是Python文件操作中最常见、也最让人头疼的问题之一。当你的TXT文件读出来一堆“锟斤拷”或者莫名其妙的符号时，八成是编码惹的祸。简单来说，文件编码就像是一种语言，你的Python程序需要用正确的“语言”去解读文件。如果文件是UTF-8编码，你却用GBK去读，那肯定就“鸡同鸭讲”了。

Python的

open()

函数默认的编码在不同操作系统上可能不一样（比如Windows上可能是GBK，Linux/macOS上可能是UTF-8），所以，最稳妥的做法是明确指定编码。

# 假设文件是GBK编码try:    with open('example_gbk.txt', 'r', encoding='gbk') as file:        content = file.read()        print("成功读取GBK文件：", content)except UnicodeDecodeError:    print("错误：尝试GBK编码失败。")except FileNotFoundError:    print("文件未找到。")# 假设文件是UTF-8编码try:    with open('example_utf8.txt', 'r', encoding='utf-8') as file:        content = file.read()        print("成功读取UTF-8文件：", content)except UnicodeDecodeError:    print("错误：尝试UTF-8编码失败。")except FileNotFoundError:    print("文件未找到。")

如何确定文件的编码？

这其实是个经验活，但也有工具可以帮忙：

文本编辑器查看： 很多高级文本编辑器（如VS Code, Sublime Text, Notepad++）在右下角或状态栏会显示当前文件的编码。

尝试常见的编码： UTF-8是目前最通用的编码，其次是GBK（中文Windows系统常见）、Latin-1（或ISO-8859-1，处理西欧语言）。你可以依次尝试这些编码，直到成功。

使用第三方库： 像

chardet

这样的Python库可以帮助你猜测文件的编码。

# 需要先安装：pip install chardetimport chardetdef detect_encoding(file_path):    with open(file_path, 'rb') as f: # 以二进制模式读取，因为chardet需要字节流        raw_data = f.read(10000) # 读取文件开头一部分数据进行猜测    result = chardet.detect(raw_data)    return result['encoding']file_path = 'my_document.txt'detected_encoding = detect_encoding(file_path)print(f"猜测文件 '{file_path}' 的编码是: {detected_encoding}")if detected_encoding:    try:        with open(file_path, 'r', encoding=detected_encoding) as file:            content = file.read()            print("使用猜测编码读取成功：", content)    except UnicodeDecodeError:        print("错误：猜测编码未能成功解码。")

即便

chardet

很强大，它也只是“猜测”，并非100%准确，尤其是文件内容较少或编码特征不明显时。但它无疑提供了一个很好的起点。

大型文件读取策略：如何高效处理GB级别的TXT文件？

当你的TXT文件达到GB级别时，直接使用

file.read()

或

file.readlines()

将整个文件加载到内存中，几乎肯定会导致内存溢出（MemoryError），程序直接崩溃。这种情况下，我们需要更“聪明”的策略，也就是逐行处理。

Python的文件对象本身就是一个迭代器。这意味着你可以像遍历列表一样遍历它，每次只加载一行到内存中，这正是处理大文件的关键。

def process_large_file_line_by_line(file_path):    line_count = 0    total_chars = 0    print(f"开始处理大型文件: {file_path}")    try:        with open(file_path, 'r', encoding='utf-8') as file:            for line in file: # 核心：直接迭代文件对象                line_count += 1                total_chars += len(line)                # 在这里对每一行进行你的具体处理                # 例如：解析数据、筛选特定内容、写入另一个文件等                if line_count % 100000 == 0: # 每处理10万行打印一次进度                    print(f"已处理 {line_count} 行...")        print(f"文件处理完成。总行数: {line_count}, 总字符数: {total_chars}")    except FileNotFoundError:        print(f"错误：文件 '{file_path}' 未找到。")    except UnicodeDecodeError:        print(f"错误：文件 '{file_path}' 编码不匹配，请检查。")# 假设有一个非常大的文件 'big_data.txt'# process_large_file_line_by_line('big_data.txt')

这种逐行迭代的方式，无论文件有多大，内存占用都保持在一个较低且稳定的水平，因为它每次只在内存中保留当前处理的这一行数据。

更高级一点的思考：生成器（Generators）

如果你需要对每一行进行一些预处理，并且这些预处理结果需要被后续的多个步骤使用，可以考虑使用生成器函数。生成器提供了一种惰性计算的方式，它不会一次性生成所有结果，而是在每次需要时才计算并返回下一个结果。

def read_lines_as_processed_data(file_path):    """一个生成器函数，用于从文件中逐行读取并进行简单处理"""    try:        with open(file_path, 'r', encoding='utf-8') as file:            for line_num, line in enumerate(file, 1):                # 假设我们只是想把每行数据转为大写，并返回行号和处理后的内容                processed_line = line.strip().upper()                yield line_num, processed_line # 使用yield关键字    except FileNotFoundError:        print(f"错误：文件 '{file_path}' 未找到。")    except UnicodeDecodeError:        print(f"错误：文件 '{file_path}' 编码不匹配。")# 使用生成器# for num, data in read_lines_as_processed_data('big_data.txt'):#     # 对data进行进一步操作#     # print(f"处理后的第 {num} 行: {data}")#     pass

生成器在处理大型数据集时非常有用，它将数据的生成和消费解耦，使得代码更清晰、内存效率更高。

写入文件时如何避免数据丢失或覆盖？

写入文件时最怕的就是不小心把原有数据冲掉，或者在多进程/多线程环境下写入冲突。Python的

open()

函数通过不同的模式来控制这种行为，理解它们是避免数据丢失的关键。

'w'

(write) 模式：这是最需要小心的模式。如果文件存在，它会截断文件（清空所有内容）然后写入；如果文件不存在，它会创建新文件。

何时使用： 当你明确知道要创建一个全新的文件，或者要完全替换现有文件的内容时。风险： 误用会导致原有数据彻底丢失。

# 第一次运行：创建文件并写入with open('safe_write.txt', 'w', encoding='utf-8') as f:    f.write("这是第一次写入的内容。n")print("safe_write.txt (w模式) 第一次写入完成。")# 第二次运行：会覆盖第一次写入的内容with open('safe_write.txt', 'w', encoding='utf-8') as f:    f.write("这是第二次写入的内容，覆盖了第一次。n")print("safe_write.txt (w模式) 第二次写入完成，内容已被覆盖。")

'a'

(append) 模式：这是最安全的写入模式之一。如果文件存在，它会在文件末尾追加内容；如果文件不存在，它会创建新文件。

何时使用： 当你需要向日志文件添加记录、或在现有数据末尾追加新数据时。优点： 不会覆盖原有数据。

# 第一次运行：创建文件并写入with open('safe_append.txt', 'a', encoding='utf-8') as f:    f.write("这是第一次追加的内容。n")print("safe_append.txt (a模式) 第一次追加完成。")# 第二次运行：会在文件末尾添加新内容with open('safe_append.txt', 'a', encoding='utf-8') as f:    f.write("这是第二次追加的内容。n")print("safe_append.txt (a模式) 第二次追加完成，内容已在末尾添加。")

'x'

(exclusive creation) 模式：这个模式是专门为防止覆盖而设计的。它要求文件必须不存在，如果文件已存在，

open()

函数会抛出

FileExistsError

异常。

何时使用： 当你希望确保你正在创建一个全新的文件，并且不希望覆盖任何现有文件时。这在需要原子性操作（要么成功创建，要么失败，但绝不修改现有文件）的场景下非常有用。优点： 提供了最强的数据安全保障，防止意外覆盖。

try:    with open('safe_exclusive.txt', 'x', encoding='utf-8') as f:        f.write("这是通过'x'模式创建并写入的内容。n")    print("safe_exclusive.txt (x模式) 创建并写入成功。")except FileExistsError:    print("错误：文件 'safe_exclusive.txt' 已存在，'x'模式拒绝覆盖。")# 再次尝试运行，会触发FileExistsErrortry:    with open('safe_exclusive.txt', 'x', encoding='utf-8') as f:        f.write("这行内容永远不会被写入，因为文件已存在。n")except FileExistsError:    print("第二次尝试创建'safe_exclusive.txt'失败，因为文件已存在。")

确保数据写入磁盘：

flush()

和

close()

即便你使用了正确的模式，数据也可能不会立即写入物理磁盘。Python的文件操作通常会有内部缓冲区，数据会先写入缓冲区，达到一定量或文件关闭时才真正写入磁盘。

with

语句会自动处理文件关闭（

close()

），这会触发缓冲区刷新。如果你需要在文件关闭前强制数据写入磁盘，可以使用

file.flush()

方法。

with open('flush_example.txt', 'w', encoding='utf-8') as f:    f.write("这行内容可能还在缓冲区。n")    f.flush() # 强制将缓冲区内容写入磁盘    print("数据已强制刷新到磁盘。")    # 即使程序此时崩溃，这行内容也应该已经写入了。    f.write("这行内容在flush之后写入。n")# 文件退出with块时会自动关闭和刷新。

理解这些模式和机制，能让你在Python中进行文件操作时更加从容和安全。

以上就是python如何读取一个txt文件_python读写TXT文件的基本操作的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1373049.html

app linux m mac python sublime txt文件读写 windows 字节工具操作系统编码

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

python如何从网页上下载图片_python爬虫下载网页图片实战方法

上一篇 2025年12月14日 12:51:07

Python 内存映射文件优化 mmap

下一篇 2025年12月14日 12:51:21

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
3000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
3000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

如何用HTML/JS实现Windows 10设置界面鼠标移动探照灯效果？

Win10设置界面中的鼠标移动探照灯效果实现指南想要在前端开发中实现类似于Windows 10设置界面的鼠标移动探照灯效果，有两种解决方案：CSS 和 HTML/JS 组合。 CSS 实现不幸的是，仅使用CSS无法完全实现该效果。立即学习“前端免费学习笔记（深入）”； HTML/JS 实现要…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

如何用前端技术实现Windows 10 设置界面鼠标移动时的探照灯效果？

探索在前端中实现 Windows 10 设置界面鼠标移动时的探照灯效果在前端开发中，鼠标悬停在元素上时需要呈现类似于 Windows 10 设置界面所展示的探照灯效果，这其中涉及到了元素外围显示光圈效果的技术实现。 CSS 实现虽然 CSS 无法直接实现探照灯效果，但可以通过以下技巧营造出类似效…

程序猿
2025年12月24日
1000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

苹果浏览器网页背景图色差问题：如何解决背景图不一致？

网页背景图在苹果浏览器上出现色差一位用户在使用苹果浏览器访问网页时遇到一个问题，网页上方的背景图比底部的背景图明显更亮。这个问题的原因很可能是背景图没有正确配置 background-size 属性。在 windows 浏览器中，背景图可能可以自动填满整个容器，但在苹果浏览器中可能需要显式设置 …

程序猿
2025年12月24日
5000
好文分享

苹果浏览器网页背景图像为何色差？

网页背景图像在苹果浏览器的色差问题在不同浏览器中，网站的背景图像有时会出现色差。例如，在 Windows 浏览器中显示正常的上层背景图，在苹果浏览器中却比下层背景图更亮。问题原因出现此问题的原因可能是背景图像未正确设置 background-size 属性。解决方案为确保背景图像在不同浏览…

程序猿
2025年12月24日
4000
好文分享

苹果电脑浏览器背景图亮度差异：为什么网页上下部背景图色差明显？

背景图在苹果电脑浏览器上亮度差异问题描述：在网页设计中，希望上部元素的背景图与页面底部的背景图完全对齐。而在 Windows 中使用浏览器时，该效果可以正常实现。然而，在苹果电脑的浏览器中却出现了明显的色差。原因分析：如果您已经排除屏幕分辨率差异的可能性，那么很可能是背景图的 backgro…

程序猿
2025年12月24日
1000
好文分享

Bear 博客上的浅色/深色模式分步指南

我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合，在我的 bear 博客上实现了亮/暗模式切换。我是这样做的。第 1 步：设置 css css 在过去几年中获得了一些很酷的新功能，包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

程序猿
2025年12月24日
2000
好文分享

如何在 Web 开发中检测浏览器中的操作系统暗模式？

检测浏览器中的操作系统暗模式在 web 开发中，用户界面适应操作系统（os）的暗模式设置变得越来越重要。本文将重点介绍检测浏览器中 os 暗模式的方法，从而使网站能够针对不同模式调整其设计。 w3c media queries level 5 最新的 web 标准引入了 prefers-color…

程序猿
2025年12月24日
1000
好文分享

如何使用 CSS 检测操作系统是否处于暗模式？

如何在浏览器中检测操作系统是否处于暗模式？新发布的 os x 暗模式提供了在 mac 电脑上使用更具沉浸感的用户界面，但我们很多人都想知道如何在浏览器中检测这种设置。新标准检测操作系统暗模式的解决方案出现在 w3c media queries level 5 中的最新标准中：立即学习“前端免…

程序猿
2025年12月24日
1000
好文分享

如何检测浏览器环境中的操作系统暗模式？

浏览器环境中的操作系统暗模式检测在如今科技的海洋中，越来越多的设备和软件支持暗模式，以减少对眼睛的刺激并营造更舒适的视觉体验。然而，在浏览器环境中检测操作系统是否处于暗模式却是一个令人好奇的问题。检测暗模式的标准要检测操作系统在浏览器中是否处于暗模式，web 开发人员可以使用 w3c 的媒体查…

程序猿
2025年12月24日
3000
好文分享

浏览器中如何检测操作系统的暗模式设置？

浏览器中的操作系统暗模式检测近年来，随着用户对夜间浏览体验的偏好不断提高，操作系统已开始引入暗模式功能。作为一名 web 开发人员，您可能想知道如何检测浏览器中操作系统的暗模式状态，以相应地调整您网站的设计。新 media queries 水平 w3c 的 media queries level…

程序猿
2025年12月24日
1000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
3000
好文分享

如何在 VS Code 中解决折叠代码复制问题？

解决 VS Code 折叠代码复制问题在 VS Code 中使用折叠功能可以帮助组织长代码，但使用复制功能时，可能会遇到只复制可见部分的问题。以下是如何解决此问题：当代码被折叠时，可以使用以下简单操作复制整个折叠代码：按下 Ctrl + C (Windows/Linux) 或 Cmd + C …

程序猿
2025年12月24日
1000
好文分享

我在学习编程的第一周学到的工具

作为一个刚刚完成中学教育的女孩和一个精通技术并热衷于解决问题的人，几周前我开始了我的编程之旅。我的名字是OKESANJO FATHIA OPEYEMI。我很高兴能分享我在编码世界中的经验和发现。拥有计算机科学背景的我一直对编程提供的无限可能性着迷。在这篇文章中，我将反思我在学习编程的第一周中获得的关…

程序猿
2025年12月24日
1000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
1000