Python教程：高效计算文本文件中指定列的最后N个值之和与平均值

程序猿 • 2025年12月14日 18:13:59 • 用户投稿 • 阅读 1

本教程详细讲解如何使用python从结构化文本文件中提取特定数据。我们将学习如何读取文件内容、利用列表切片获取末尾n行，并对这些行的指定列（如数值列）进行求和与平均值计算，提供简洁高效的代码示例和专业指导，以解决常见的数据处理需求。

引言

在数据分析和日志处理的日常工作中，我们经常需要处理结构化的文本文件。其中一个常见的需求是，从文件的末尾（通常代表最新的数据）提取特定列的数值，并进行统计分析，例如计算其总和或平均值。本教程将以一个具体的示例，详细阐述如何使用Python高效、准确地实现这一目标。

数据结构与目标

假设我们有一个名为lista.txt的文本文件，其中记录了日期和对应的数值，每行包含两个以空格分隔的字段，格式如下：

08/12/2023 81.309/12/2023 80.810/12/2023 80.911/12/2023 81.012/12/2023 81.113/12/2023 81.514/12/2023 80.115/12/2023 81.016/12/2023 80.917/12/2023 80.6

我们的核心目标是，给定一个整数N（例如N=7），计算文件中第二列（即数值列）最后N个数值的总和及其平均值。

核心实现策略

为了高效且准确地完成上述任务，我们将采用以下分步策略：

立即学习“Python免费学习笔记（深入）”；

完整读取文件内容：首先，将整个文本文件的所有行一次性读入内存，存储为一个字符串列表。获取末尾N行数据：利用Python列表强大的切片（slice）功能，快速截取列表末尾的N个元素，即我们所需的最新的N行数据。解析并执行计算：遍历这N行数据。对每一行，使用字符串分割方法提取出第二列的数值字符串，并将其转换为浮点数类型。随后，对这些浮点数进行累加求和。计算平均值：将求得的总和除以N，即可得到平均值。

Python 代码示例

以下是实现上述逻辑的Python代码，其中包含了错误处理机制，以增强程序的健壮性：

# 定义待处理文件的完整路径file_path = '/storage/emulated/0/Python/lista.txt'# 定义需要计算的末尾行数NN = 7try:    # 1. 安全地打开并读取文件所有行    # 'r' 表示只读模式，encoding='utf-8' 指定文件编码以避免乱码    with open(file_path, 'r', encoding='utf-8') as f:        lines = f.readlines()    # 2. 健壮性检查：文件是否为空或行数是否小于N    if not lines:        print("文件为空，无法进行计算。")        # 退出程序或进行其他处理        exit()    total_lines = len(lines)    if total_lines < N:        print(f"警告：文件中只有 {total_lines} 行，不足 {N} 行。将计算所有行的总和与平均值。")        N = total_lines # 调整N为实际行数，以避免索引错误    # 3. 获取末尾N行数据    # 列表切片 [-N:] 能够高效地获取列表的最后N个元素    last_N_lines = lines[-N:]    # 4. 提取第二列数值并求和    # 使用生成器表达式结合 sum() 函数，代码简洁且高效    # line.split() 将行按空格分割成字符串列表    # [1] 获取分割后列表的第二个元素（索引为1），即数值字符串    # float() 将数值字符串转换为浮点数    mysum = sum(float(line.split()[1]) for line in last_N_lines)    # 5. 计算平均值    average = mysum / N    # 6. 输出结果    # {:.2f} 格式化浮点数，保留两位小数    print(f"文件 '{file_path}' 中最后 {N} 个值的总和: {mysum:.2f}")    print(f"文件 '{file_path}' 中最后 {N} 个值的平均值: {average:.2f}")except FileNotFoundError:    print(f"错误：文件 '{file_path}' 未找到。请检查文件路径是否正确。")except IndexError:    print("错误：文件内容格式不正确，无法提取第二列数据。请确保每行至少有两列。")except ValueError:    print("错误：文件第二列包含非数值数据，无法转换为浮点数。请检查数据格式。")except ZeroDivisionError:    print("错误：尝试除以零，可能是文件为空或N值为0。")except Exception as e:    print(f"发生未知错误: {e}")

代码解析

file_path = ‘…’: 定义了待处理文本文件的完整路径。请根据实际情况修改此路径。N = 7: 设置了我们希望计算的末尾行数。这个值可以根据您的需求进行调整。with open(file_path, ‘r’, encoding=’utf-8′) as f::这是Python中处理文件的推荐方式。with语句确保文件在操作完成后（无论是否发生错误）都会被正确关闭，避免资源泄露。’r’参数表示以只读模式打开文件。encoding=’utf-8’参数明确指定了文件的编码格式，这对于处理包含非ASCII字符（如中文）的文件至关重要，可以有效避免编码错误。lines = f.readlines(): 此方法读取文件的所有行，并将它们存储在一个列表中。列表的每个元素都是文件中的一行（包含换行符n）。if len(lines) : 这是一个重要的健壮性检查。如果文件的总行数少于我们期望的N值，程序会发出警告并自动将N调整为文件的实际行数，从而避免因尝试访问不存在的索引而导致的IndexError。last_N_lines = lines[-N:]: 这是获取末尾N行数据的核心操作。Python列表的切片功能非常强大，[-N:]语法能够从列表末尾向前截取N个元素，返回一个新的列表，其中包含最新的N行数据。mysum = sum(float(line.split()[1]) for line in last_N_lines):这是一个高效且简洁的生成器表达式（Generator Expression）与sum()函数结合的用法。for line in last_N_lines: 迭代last_N_lines列表中的每一行字符串。line.split(): 对当前行字符串进行分割。默认情况下，split()会根据空格符（包括多个空格、制表符等）分割字符串，并返回一个字符串列表。例如，”17/12/2023 80.6″.split()会得到[’17/12/2023′, ‘80.6’]。[1]: 访问分割后列表的第二个元素（索引为1），即我们所需的数值字符串（例如’80.6’）。float(…): 将提取到的数值字符串转换为浮点数类型，以便进行数学计算。sum(…): 对所有由生成器表达式产生的浮点数进行累加求和。average = mysum / N: 计算求得的总和与N的商，即为平均值。print(f”…”): 使用F-string进行格式化输出，{mysum:.2f}和{average:.2f}将浮点数格式化为保留两位小数。try…except 错误处理: 代码中包含了多个except块，用于捕获可能发生的常见错误：FileNotFoundError: 当指定的文件路径不存在时触发。IndexError: 当line.split()[1]操作失败时，通常意味着某行没有足够的列（例如，只有一列数据）。ValueError: 当float()函数尝试转换一个非数值字符串时触发，表明第二列数据不是有效的数字。ZeroDivisionError: 当N为0时（例如文件为空），尝试进行除法运算会触发此错误。Exception as e: 捕获其他所有未预料到的错误，提供更全面的错误信息。

注意事项与最佳实践

文件路径的准确性：确保file_path变量指向的文件实际存在且路径正确。在不同操作系统中，文件路径的表示方式可能略有差异（例如，Windows系统倾向于使用反斜杠，但Python中建议使用正斜杠/或原始字符串r’…’来避免转义问题）。数据格式的一致性：本教程的代码假定文件的每一行都至少有两列，并且第二列的数据总是可以转换为浮点数的有效数字。如果文件格式不一致（例如，某些行只有一列，或第二列包含文本），则可能导致IndexError或ValueError。在实际应用中，您可能需要更复杂的解析逻辑和更严格的数据校验。内存消耗：f.readlines()方法会将文件的所有内容一次性加载到内存中。对于非常大的文件（例如，GB级别），这可能导致内存溢出（MemoryError）。对于这类超大文件，更优的策略是逐行读取，并使用collections.deque等数据结构来维护一个固定大小的滑动窗口，以减少内存占用。然而，对于大多数常见大小的文件，readlines()方法是简洁且高效的选择。编码的重要性：明确指定文件编码（如encoding=’utf-8’）是一个良好的编程习惯。它可以避免因系统默认编码与文件实际编码不匹配而导致的乱码或UnicodeDecodeError。N值的验证：代码中已加入对N值与文件实际行数关系的检查，这增强了程序的鲁棒性。始终考虑边界条件，例如文件为空或N值大于文件总行数的情况。

总结

通过本教程，我们学习了如何利用Python高效地从结构化文本文件中提取并计算指定列的末尾N个值的总和与平均值。核心技术在于f.readlines()一次性读取所有行，lines[-N:]进行列表切片以获取最新数据，并结合生成器表达式进行数据解析和计算。这种方法简洁、高效且易于理解，适用于处理中小型结构化文本文件的数据分析任务。在实际应用中，结合完善的错误处理和对文件大小的考量，可以构建出更加健壮和高效的数据处理脚本。

以上就是Python教程：高效计算文本文件中指定列的最后N个值之和与平均值的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1377963.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Python中高效且简洁的列表初始化方法

上一篇 2025年12月14日 18:13:57

Pygame中绘制动态矢量箭头的技巧与常见陷阱

下一篇 2025年12月14日 18:14:02

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
4000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
3000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
好文分享

如何用HTML/JS实现Windows 10设置界面鼠标移动探照灯效果？

Win10设置界面中的鼠标移动探照灯效果实现指南想要在前端开发中实现类似于Windows 10设置界面的鼠标移动探照灯效果，有两种解决方案：CSS 和 HTML/JS 组合。 CSS 实现不幸的是，仅使用CSS无法完全实现该效果。立即学习“前端免费学习笔记（深入）”； HTML/JS 实现要…

程序猿
2025年12月24日
1000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
好文分享

如何用前端技术实现Windows 10 设置界面鼠标移动时的探照灯效果？

探索在前端中实现 Windows 10 设置界面鼠标移动时的探照灯效果在前端开发中，鼠标悬停在元素上时需要呈现类似于 Windows 10 设置界面所展示的探照灯效果，这其中涉及到了元素外围显示光圈效果的技术实现。 CSS 实现虽然 CSS 无法直接实现探照灯效果，但可以通过以下技巧营造出类似效…

程序猿
2025年12月24日
1000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

苹果浏览器网页背景图色差问题：如何解决背景图不一致？

网页背景图在苹果浏览器上出现色差一位用户在使用苹果浏览器访问网页时遇到一个问题，网页上方的背景图比底部的背景图明显更亮。这个问题的原因很可能是背景图没有正确配置 background-size 属性。在 windows 浏览器中，背景图可能可以自动填满整个容器，但在苹果浏览器中可能需要显式设置 …

程序猿
2025年12月24日
5000
好文分享

苹果浏览器网页背景图像为何色差？

网页背景图像在苹果浏览器的色差问题在不同浏览器中，网站的背景图像有时会出现色差。例如，在 Windows 浏览器中显示正常的上层背景图，在苹果浏览器中却比下层背景图更亮。问题原因出现此问题的原因可能是背景图像未正确设置 background-size 属性。解决方案为确保背景图像在不同浏览…

程序猿
2025年12月24日
4000
好文分享

苹果电脑浏览器背景图亮度差异：为什么网页上下部背景图色差明显？

背景图在苹果电脑浏览器上亮度差异问题描述：在网页设计中，希望上部元素的背景图与页面底部的背景图完全对齐。而在 Windows 中使用浏览器时，该效果可以正常实现。然而，在苹果电脑的浏览器中却出现了明显的色差。原因分析：如果您已经排除屏幕分辨率差异的可能性，那么很可能是背景图的 backgro…

程序猿
2025年12月24日
1000
好文分享

Bear 博客上的浅色/深色模式分步指南

我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合，在我的 bear 博客上实现了亮/暗模式切换。我是这样做的。第 1 步：设置 css css 在过去几年中获得了一些很酷的新功能，包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

程序猿
2025年12月24日
2000
好文分享

如何在 Web 开发中检测浏览器中的操作系统暗模式？

检测浏览器中的操作系统暗模式在 web 开发中，用户界面适应操作系统（os）的暗模式设置变得越来越重要。本文将重点介绍检测浏览器中 os 暗模式的方法，从而使网站能够针对不同模式调整其设计。 w3c media queries level 5 最新的 web 标准引入了 prefers-color…

程序猿
2025年12月24日
1000
好文分享

如何使用 CSS 检测操作系统是否处于暗模式？

如何在浏览器中检测操作系统是否处于暗模式？新发布的 os x 暗模式提供了在 mac 电脑上使用更具沉浸感的用户界面，但我们很多人都想知道如何在浏览器中检测这种设置。新标准检测操作系统暗模式的解决方案出现在 w3c media queries level 5 中的最新标准中：立即学习“前端免…

程序猿
2025年12月24日
1000
好文分享

如何检测浏览器环境中的操作系统暗模式？

浏览器环境中的操作系统暗模式检测在如今科技的海洋中，越来越多的设备和软件支持暗模式，以减少对眼睛的刺激并营造更舒适的视觉体验。然而，在浏览器环境中检测操作系统是否处于暗模式却是一个令人好奇的问题。检测暗模式的标准要检测操作系统在浏览器中是否处于暗模式，web 开发人员可以使用 w3c 的媒体查…

程序猿
2025年12月24日
3000
好文分享

浏览器中如何检测操作系统的暗模式设置？

浏览器中的操作系统暗模式检测近年来，随着用户对夜间浏览体验的偏好不断提高，操作系统已开始引入暗模式功能。作为一名 web 开发人员，您可能想知道如何检测浏览器中操作系统的暗模式状态，以相应地调整您网站的设计。新 media queries 水平 w3c 的 media queries level…

程序猿
2025年12月24日
1000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
3000
好文分享

如何在 VS Code 中解决折叠代码复制问题？

解决 VS Code 折叠代码复制问题在 VS Code 中使用折叠功能可以帮助组织长代码，但使用复制功能时，可能会遇到只复制可见部分的问题。以下是如何解决此问题：当代码被折叠时，可以使用以下简单操作复制整个折叠代码：按下 Ctrl + C (Windows/Linux) 或 Cmd + C …

程序猿
2025年12月24日
1000
好文分享

我在学习编程的第一周学到的工具

作为一个刚刚完成中学教育的女孩和一个精通技术并热衷于解决问题的人，几周前我开始了我的编程之旅。我的名字是OKESANJO FATHIA OPEYEMI。我很高兴能分享我在编码世界中的经验和发现。拥有计算机科学背景的我一直对编程提供的无限可能性着迷。在这篇文章中，我将反思我在学习编程的第一周中获得的关…

程序猿
2025年12月24日
1000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
1000