在Python中为Excel文件的每个工作表添加列名

在python中为excel文件的每个工作表添加列名

本文旨在提供一个Python解决方案,用于批量处理Excel文件,并将文件名作为新列添加到每个工作表中。通过使用pandas库,我们可以高效地读取、修改和保存Excel文件,从而简化数据处理流程。本文将详细介绍实现步骤,并提供可直接使用的代码示例,帮助读者快速掌握该技巧。

在数据处理过程中,经常需要批量处理Excel文件,并对每个工作表进行相同的操作。一个常见的需求是将文件名添加到每个工作表中作为一个新的列。以下是如何使用Python的pandas库来实现这一目标的详细步骤和示例代码。

步骤详解

导入必要的库: 首先,我们需要导入os库用于文件路径操作,以及pandas库用于Excel文件的读写。

import osimport pandas as pd

指定文件路径: 定义包含Excel文件的根目录路径。请注意替换’XXXX’为实际的路径。

立即学习“Python免费学习笔记(深入)”;

path = 'XXXX'

遍历文件: 使用os.walk()函数遍历指定路径下的所有文件。os.walk()会返回一个三元组 (roots, dirs, files),分别表示当前目录路径、子目录列表和文件列表。

for roots, dirs, files in os.walk(path):    xlsfile = [f for f in files if f.endswith('.xlsx')]

这里使用列表推导式筛选出所有以.xlsx结尾的文件。

处理每个Excel文件: 遍历筛选出的Excel文件列表。

for xlsf in xlsfile:    print(xlsf)    excel_path = os.path.join(roots, xlsf)    xls = pd.ExcelFile(excel_path)

excel_path = os.path.join(roots, xlsf): 构建Excel文件的完整路径。xls = pd.ExcelFile(excel_path): 使用pd.ExcelFile对象读取Excel文件,这可以更高效地处理包含多个工作表的Excel文件。

读取并修改每个工作表: 使用pd.ExcelWriter和循环遍历工作表来处理每个工作表。

with pd.ExcelWriter(excel_path, engine='openpyxl') as writer:    for sheet_name in xls.sheet_names:        df = pd.read_excel(xls, sheet_name)        df['filename'] = xlsf.split("-")[-2]        df.to_excel(writer, sheet_name=sheet_name, index=False)

with pd.ExcelWriter(excel_path, engine=’openpyxl’) as writer:: 创建一个ExcelWriter对象,用于将修改后的数据写回原始Excel文件。使用with语句可以确保文件在使用完毕后被正确关闭。 engine=’openpyxl’ 指定了使用 openpyxl 引擎,该引擎支持 .xlsx 格式。for sheet_name in xls.sheet_names:: 遍历Excel文件中的每个工作表。df = pd.read_excel(xls, sheet_name): 读取当前工作表的数据到DataFrame对象df。df[‘filename’] = xlsf.split(“-“)[-2]: 创建一个名为filename的新列,并将文件名(从文件名中提取的部分)赋值给该列的每一行。这里假设文件名格式为 …-部分内容-….xlsx,需要提取中间的部分内容。df.to_excel(writer, sheet_name=sheet_name, index=False): 将修改后的DataFrame写回到Excel文件的当前工作表。index=False表示不写入索引列。

完整代码示例

import osimport pandas as pdpath = 'XXXX'  # 替换为你的实际路径for roots, dirs, files in os.walk(path):    xlsfile = [f for f in files if f.endswith('.xlsx')]    for xlsf in xlsfile:        print(xlsf)        excel_path = os.path.join(roots, xlsf)        xls = pd.ExcelFile(excel_path)        with pd.ExcelWriter(excel_path, engine='openpyxl') as writer:            for sheet_name in xls.sheet_names:                df = pd.read_excel(xls, sheet_name)                df['filename'] = xlsf.split("-")[-2]                df.to_excel(writer, sheet_name=sheet_name, index=False)

注意事项

文件名格式: 代码中的 xlsf.split(“-“)[-2] 假设文件名包含 – 分隔符,并且需要提取倒数第二个部分。请根据实际文件名格式进行调整。依赖库: 确保安装了 pandas 和 openpyxl 库。可以使用 pip install pandas openpyxl 命令进行安装。文件路径: 确保提供的文件路径是正确的,并且程序有权限访问该路径下的文件。引擎选择: engine=’openpyxl’ 确保程序可以处理 .xlsx 格式的文件。如果处理 .xls 格式的文件,可能需要使用 xlrd 和 xlwt 库,并指定相应的引擎。数据安全: 在处理大量数据时,建议先在一个小的测试数据集上进行测试,确保代码的正确性,避免意外修改或损坏原始数据。

总结

本文提供了一个清晰、可操作的Python脚本,用于批量处理Excel文件,并将文件名作为新列添加到每个工作表中。通过使用pandas库和openpyxl引擎,可以高效地完成这项任务。在实际应用中,可以根据具体需求修改代码,例如调整文件名提取规则、添加错误处理机制等,以满足不同的数据处理场景。

以上就是在Python中为Excel文件的每个工作表添加列名的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1374736.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 14:24:54
下一篇 2025年12月14日 14:25:02

相关推荐

  • 技术栈收敛是否就是技术栈选型?

    技术栈收敛与选型的细致解读 技术开发中,技术栈收敛和选型经常被提及,但两者并非完全等同。本文将深入探讨它们之间的关系。 技术栈选型指的是在项目初期或特定需求下,从多个可行方案中选择合适的技术组合的过程。例如,后端可以选择Java、Python或Go,前端可以选择React、Vue或Angular等。…

    2025年12月15日
    000
  • 服务端如何使用操作系统API检测Socket连接断开?

    探究 socket 连接断开检测的 api 许多开发者在进行网络编程时,都会遇到这样一个问题:如何可靠地判断一个 Socket 连接是否已经断开?尤其是在客户端主动关闭连接后,服务端如何感知到连接的终止?本文将深入探讨操作系统提供的 API,以及如何利用这些 API 来检测 Socket 连接的断开…

    好文分享 2025年12月15日
    000
  • Go语言中,以”_”开头的文件名有什么特殊含义?

    go语言中,文件名以”_”开头并非语言规范规定的特殊含义。go语言本身的文档并未对这种命名方式进行说明。go语言包的命名通常采用直接连接的英文单词,例如cputicks。 然而,在实际项目中,”_”开头的文件名或文件夹经常出现,这通常是受到其他编程语言…

    2025年12月15日
    000
  • 在Golang中如何实现Linux iptables链表的增删查改操作?

    Golang高效管理Linux iptables规则 Linux系统管理员经常使用iptables管理网络流量和安全策略。本文将指导您如何在Golang中高效地操作iptables规则,包括添加、删除、查询和修改。 与Python的python-iptables库类似,Golang也提供了相应的库来…

    2025年12月15日
    000
  • 在protobuf中如何将枚举值与字符串常量关联?

    Protobuf 枚举类型与字符串常量的关联 本文探讨如何在protobuf中定义枚举类型,并为每个枚举值关联一个字符串常量,方便在不同编程语言中使用。 你可能已经定义了一个简单的枚举类型,例如: enum Types { TYPE_0 = 0; TYPE_1 = 1; TYPE_2 = 2;} 直…

    2025年12月15日
    000
  • 如何在protobuf中定义枚举类型并关联字符串常量?

    Protobuf 枚举类型与字符串常量的关联 在使用 Protocol Buffer (protobuf) 时,经常需要将枚举类型与友好的字符串描述关联起来,方便代码阅读和调试。虽然 Protobuf .proto 文件本身并不直接支持在枚举定义中添加字符串常量,但 protobuf 编译器会自动生…

    2025年12月15日
    000
  • 学完Flask后,为什么选择Gin而不是Beego?

    Gin还是Beego?Flask学习者Go语言框架选择指南 学习编程语言和框架时,选择合适的工具至关重要。本文针对一位学习完Python Flask框架,并希望学习Go语言框架的朋友,比较Gin和Beego,推荐Gin框架,并阐述原因。 虽然许多文章建议直接使用Go语言的原生std http库,但考…

    2025年12月15日
    000
  • 技术栈收敛是否就是技术栈的选型?

    技术栈收敛:并非简单的技术选型 许多人将技术栈收敛等同于技术选型,认为只是在A、B等多种技术方案中进行选择。 这种理解过于简化。技术栈收敛是一个更动态、更复杂的过程,它贯穿于整个项目生命周期。 技术栈选型是收敛的起点,但收敛本身是一个持续优化的过程。 项目初期,为了快速验证想法或满足特定需求,可能会…

    2025年12月15日
    000
  • 后端开发语言性能PK:哪种语言最省资源?

    后端开发语言性能:资源消耗大比拼 选择合适的编程语言和框架对后端开发至关重要,尤其是在资源利用率方面。 Java、Python、C++、Go等众多语言都能构建高性能后端应用,但哪种语言及其框架能最有效地利用计算机资源? 这取决于具体应用场景和需求,没有绝对的“最佳选择”。 我们将几种常见后端语言的资…

    2025年12月15日
    000
  • 多云主机文件共享:如何简单可靠地构建共享文件系统?

    多云主机文件共享的简易方案 在多云环境下,构建可靠的共享文件系统是许多开发者的共同需求。本文将介绍一种简单、可靠且易于部署的解决方案,满足多云主机间共享目录文件的需求,并支持Go或Python开发。 文章探讨了在多台云主机上共享目录文件,并兼顾稳定性和易部署性的方法。提问者曾考虑FastDFS,但最…

    2025年12月15日
    000
  • 技术栈收敛是否仅仅是技术栈选型的过程?

    技术栈收敛:超越单纯的技术选型 软件开发中的技术栈选择与管理至关重要。本文探讨技术栈收敛与技术选型的关系,澄清一个常见误区:技术栈收敛并非仅仅是简单的技术选型。 读者疑问 近期,一位读者提出疑问:在项目开发中,技术栈收敛是否等同于技术选型?他阅读文章时发现,技术栈收敛被描述为在A和B两种技术栈中选择…

    2025年12月15日
    000
  • 如何用PHP、JS、Python或Go实现PDF文档中图片的悬浮盖章效果?

    在pdf文档中,实现图片悬浮于文本上方,如同盖章效果,并非易事。本文探讨如何利用php、js、python或go语言实现此功能。 直接修改PDF格式较为困难,因此需借助PDF处理库。 PHP: TCPDF或FPDF等库可用于插入图片并控制位置,但精确控制图片悬浮于文本上方需要额外计算文本和图片坐标,…

    2025年12月15日
    000
  • Go和Rust需要运行时环境吗?

    Go 和 Rust:编译型语言的运行机制 Java 需要 JRE,Python 需要解释器,那么 Go 和 Rust 呢?这需要理解编译型语言和解释型语言的差异。 不同于 Java 和 Python 这样的解释型语言,Go 和 Rust 是编译型语言。解释型语言依赖解释器逐行执行代码,而编译型语言则…

    2025年12月15日
    000
  • 在学习了Flask之后,是否应该选择Gin框架来学习Go语言?

    从Flask到Gin:Go语言框架的选择 学习完Python的Flask框架后,许多开发者希望继续探索Go语言的Web框架。Gin和Flask都以轻量级著称,该如何选择呢?本文将为您分析,助您做出最佳决策。 网上关于这个问题的讨论很多,有人建议直接使用Go语言的标准库net/http。诚然,所有框架…

    2025年12月15日
    000
  • Java、Go、Rust、Python和C语言:它们各自的运行时环境究竟是什么?

    深入理解编程语言的运行机制:什么是运行时? 许多程序员在学习编程时,常常对“运行时”感到困惑。 Java、Go、Rust、Python和C语言这些常用语言,它们都有运行时吗?各自的运行时环境又是什么样的呢?本文将对此进行详细解释。 简单地将编程语言分为解释型和编译型,并以此否定运行时的存在,是不准确…

    2025年12月15日
    000
  • Go和Java如何不依赖内联汇编实现协程?

    go、java 等语言的协程实现:无需内联汇编的奥秘 本文将探讨 Go、Java 等高级语言如何在不依赖内联汇编直接操作寄存器的情况下实现协程,特别是针对问题中提到的 Python greenlet 库通过 C 和内联汇编实现无感知函数帧栈切换的对比。 Python 的 greenlet 库利用 C…

    好文分享 2025年12月15日
    000
  • Go语言如何实现PHP的字典排序和签名生成?

    go语言实现php字典排序和签名生成详解 本文介绍如何使用Go语言实现与PHP类似的字典排序和签名生成功能。 PHP代码通常使用ksort对字典排序,然后用http_build_query序列化,最后计算MD5签名。 Go语言需要找到等效的实现方法。 我们先来看PHP代码示例: $params = …

    2025年12月15日
    000
  • 在Golang中如何使用库对Linux iptables进行增删查改操作?

    高效管理Linux防火墙:Golang与iptables的完美结合 Linux系统中的iptables防火墙功能强大,但手动配置较为繁琐。本文将介绍如何利用Golang语言高效管理iptables规则,实现增删查改等操作。 Python拥有python-iptables库,Golang也有类似的解决…

    2025年12月15日
    000
  • 如何使用Golang库来对Linux的iptables链表进行增删查改操作?

    Golang高效管理Linux iptables防火墙规则 Linux系统中的iptables是强大的防火墙工具,用于控制网络数据包的过滤和转发。本文介绍如何使用Golang高效地管理iptables规则,包括添加、删除、查询和修改操作。 Python拥有python-iptables库简化此过程,…

    2025年12月15日
    000
  • Python和Golang协程:实现方式有何不同及优劣如何?

    python与golang协程的差异探究 本文将深入探讨python和golang协程的异同。虽然两种语言都支持协程,实现协程的概念也一致——非阻塞、非独占地共享cpu时间片——但其具体的实现方式和使用体验却存在显着区别。 首先,需要明确的是,无论哪种语言,协程的核心概念都是相同的。它允许程序并发执…

    好文分享 2025年12月15日
    000

发表回复

登录后才能评论
关注微信