Python Pandas批量为Excel多Sheet添加列名

python pandas批量为excel多sheet添加列名

本文旨在解决使用Python Pandas库批量为Excel文件中多个Sheet添加相同列名的问题。通过遍历Excel文件的所有Sheet,并利用Pandas的ExcelWriter对象,将文件名作为新列添加到每个Sheet中,从而实现数据的批量处理。本文提供详细代码示例,并解释关键步骤,帮助读者快速掌握该技巧。

在使用Python处理Excel数据时,经常会遇到需要在多个Sheet中添加相同列的情况。例如,需要将文件名作为一列添加到每个Sheet中,以便于后续的数据分析和处理。 Pandas库提供了强大的Excel读写功能,结合ExcelWriter可以方便地实现批量操作。

以下代码展示了如何使用Pandas遍历Excel文件的所有Sheet,并将文件名作为新列添加到每个Sheet中:

import osimport pandas as pdpath = 'XXXX'  # 请替换为你的Excel文件所在目录for roots, dirs, files in os.walk(path):    xlsfile = [f for f in files if f.endswith('.xlsx')]    for xlsf in xlsfile:        print(xlsf)        excel_path = os.path.join(roots, xlsf)        xls = pd.ExcelFile(excel_path)        with pd.ExcelWriter(excel_path, engine='openpyxl') as writer:            for sheet_name in xls.sheet_names:                df = pd.read_excel(xls, sheet_name)                df['filename'] = xlsf.split("-")[-2]                df.to_excel(writer, sheet_name=sheet_name, index=False)

代码解释:

立即学习“Python免费学习笔记(深入)”;

导入必要的库: os 用于文件路径操作,pandas 用于数据处理。设置文件路径: 将path变量设置为包含Excel文件的目录。 注意:需要将XXXX替换为你实际的路径。遍历文件: 使用os.walk遍历指定目录下的所有文件。筛选Excel文件: 使用列表推导式[f for f in files if f.endswith(‘.xlsx’)]筛选出所有以.xlsx结尾的文件。循环处理每个Excel文件:使用pd.ExcelFile(excel_path)读取Excel文件,获取ExcelFile对象。使用pd.ExcelWriter(excel_path, engine=’openpyxl’)创建一个ExcelWriter对象,用于将修改后的数据写回Excel文件。 engine=’openpyxl’指定使用openpyxl引擎,支持写入多个Sheet。循环遍历xls.sheet_names,获取每个Sheet的名称。使用pd.read_excel(xls, sheet_name)读取指定Sheet的数据到DataFrame。添加新的列filename,其值为文件名经过处理后的结果。 在这里,文件名通过xlsf.split(“-“)[-2]进行分割,取倒数第二个部分。 注意:这个分割方式是基于你的文件名格式,需要根据实际情况进行调整。使用df.to_excel(writer, sheet_name=sheet_name, index=False)将修改后的DataFrame写回Excel文件,index=False表示不写入索引列。保存修改: with语句会自动关闭ExcelWriter对象,从而保存所有修改。

注意事项:

文件名分割: xlsf.split(“-“)[-2]这部分代码是根据文件名格式进行分割的,需要根据实际的文件名格式进行调整。 例如,如果文件名是data_2023-10-26.xlsx,并且你想要提取日期2023-10-26作为filename列的值,那么这段代码是适用的。 如果文件名格式不同,则需要修改分割符和索引值。文件路径: 确保path变量指向的目录是正确的,并且包含需要处理的Excel文件。引擎选择: engine=’openpyxl’ 是一个重要的参数,用于指定使用的Excel写入引擎。 openpyxl 引擎支持写入多个Sheet,因此是批量处理Excel文件的必要选择。 如果没有指定引擎,可能会出现写入错误。覆盖原文件: 这段代码会直接覆盖原Excel文件。 在运行代码之前,建议备份原始文件,以防数据丢失依赖安装: 确保已经安装了pandas和openpyxl库。 可以使用pip install pandas openpyxl命令进行安装。

总结:

通过结合pd.ExcelFile和pd.ExcelWriter,可以方便地实现批量处理Excel文件的需求。 本文提供了一个简单的示例,展示了如何批量为Excel文件的所有Sheet添加相同列名。 在实际应用中,可以根据具体需求修改代码,例如修改文件名分割方式、添加不同的列值等。 掌握这种批量处理技巧,可以大大提高数据处理的效率。

以上就是Python Pandas批量为Excel多Sheet添加列名的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1374730.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 14:24:47
下一篇 2025年12月14日 14:24:52

相关推荐

  • 如何避免 Python 模块导入导致文档字符串丢失

    正如本文摘要所述,理解 Python 模块导入和文档字符串之间的关系,遵循 PEP 8 规范,是避免文档字符串丢失的关键。 Python 模块的文档字符串 (__doc__) 是模块的重要组成部分,用于提供模块的简要说明和使用方法。 然而,在某些情况下,模块导入可能会导致文档字符串变为 None,这…

    好文分享 2025年12月14日
    000
  • Python中高效管理文件路径:利用os.path.join访问非同目录资源

    本教程详细介绍了在Python项目中如何优雅地访问位于不同目录下的资源文件,特别是针对Pygame等场景中的音频文件。我们将学习如何使用os.path.join模块构建跨平台的相对路径,从而确保程序能够准确加载所需资源,提升项目结构清晰度和可维护性。 在开发python应用程序时,特别是涉及多媒体资…

    2025年12月14日
    000
  • Python Pygame教程:访问不同目录下的音频文件

    摘要:本文旨在帮助初学者解决在使用Pygame的mixer模块时,如何访问位于不同目录下的音频文件。通过使用os模块的join()函数,我们可以轻松构建正确的音频文件路径,从而实现在不同目录结构下加载和播放音频资源。本文将提供详细的代码示例和解释,帮助你理解和应用这一技术。 在使用Pygame开发游…

    2025年12月14日
    000
  • python静态web服务器如何实现

    答案:Python可通过http.server模块或socket实现静态Web服务器。使用http.server模块可在终端运行%ignore_a_1% -m http.server 8000快速启动服务;也可自定义类继承BaseHTTPRequestHandler处理GET请求,读取本地文件并返回…

    2025年12月14日
    000
  • Python中跨目录访问文件:以Pygame音频加载为例

    本文将指导初学者如何在Python Pygame项目中,通过使用os模块的os.path.join函数,有效地从不同目录加载音频文件。通过构建相对路径,即使音频文件不在脚本的同级目录,也能确保程序正确访问,解决文件路径管理问题,提升项目结构清晰度。 在python编程,特别是涉及多媒体资源(如音频、…

    2025年12月14日
    000
  • python中seek怎么用

    seek()方法用于调整文件指针位置,语法为file.seek(offset, whence),其中offset为偏移量,whence指定起始位置(0开头、1当前位置、2末尾)。文本模式下whence只能为0,二进制模式支持1和2。常与tell()配合使用,可实现精确读写。推荐用with语句管理文件…

    2025年12月14日
    000
  • python实例创建销毁的函数整理

    答案:Python中实例的创建由__new__和__init__控制,销毁由__del__负责;__new__静态方法创建实例,__init__初始化属性,__del__在垃圾回收前调用但不保证立即执行;推荐使用上下文管理器或显式close方法进行资源管理。 在 Python 中,实例的创建和销毁由…

    2025年12月14日
    000
  • python Decimal解决计算问题

    浮点数计算不精确是因二进制无法精确表示部分十进制小数,导致如0.1+0.2≠0.3;Python的decimal模块通过Decimal类以十进制存储数值,避免此问题,需用字符串初始化并可设置精度与舍入方式,适用于金融、科学等高精度场景。 在Python中进行浮点数运算时,经常会遇到精度问题。比如 0…

    2025年12月14日
    000
  • 提升Python代码效率:通过迭代简化Turtle对象操作

    本文探讨了如何在Python turtle模块中优化重复代码,通过将多个turtle对象组织成可迭代集合,并利用循环结构统一管理它们的行为。这种方法不仅显著提升了代码的简洁性和可维护性,也为实现多turtle对象看似同步的运动提供了高效的解决方案,有效避免了冗余代码的生成。 一、识别与优化重复代码 …

    2025年12月14日
    000
  • 基于 Pandas 的条件判断新增列:Jupyter Notebook 实用指南

    本文旨在指导读者如何在 Jupyter Notebook 中使用 Python 的 Pandas 库,基于现有数据列的条件判断,高效地创建新的数据列。我们将详细讲解如何使用 .loc 方法,并提供多种实现方式,包括使用单个条件语句和预设默认值的方法,以提升数据处理的效率和代码的可读性。 使用 Pan…

    2025年12月14日
    000
  • Python模块导入与文档字符串(Docstring)消失问题详解

    本文旨在解释在Python中,当使用import语句导入模块后,模块的文档字符串(docstring)变为None的现象。我们将深入探讨这一问题的原因,并提供正确的模块导入方式,以确保文档字符串能够正确加载。 模块导入与文档字符串 在Python中,文档字符串(docstring)是位于模块、类、函…

    2025年12月14日
    000
  • 在Docker容器中正确安装和配置wkhtmltopdf可执行文件

    本文旨在解决在Docker容器中使用Python wk%ignore_a_1%topdf或pdfkit库时,因缺少wkhtmltopdf可执行文件而导致的OSError。核心问题在于Python库仅为封装,实际的wkhtmltopdf二进制文件需独立安装。教程将详细指导如何在Dockerfile中通…

    2025年12月14日
    000
  • 在 Python 中使用 Pandas 根据条件创建新列

    本文介绍了如何使用 Pandas 在 DataFrame 中基于现有列的条件判断创建新列。通过 df.loc 方法,我们可以高效地根据条件为新列赋值。文章提供了详细的代码示例,展示了如何使用单个条件或组合条件来创建新列,并提供了优化技巧,避免不必要的代码冗余。 在数据分析和处理中,经常需要根据现有列…

    2025年12月14日
    000
  • Python随机数中种子的使用

    随机数种子用于初始化伪随机数生成器,确保每次运行时产生相同的随机序列。通过random.seed()或np.random.seed()设置相同种子值,可使后续生成的随机数序列完全一致,适用于调试、测试和机器学习等需结果复现的场景;若不设种子,则默认使用系统时间导致每次结果不同。Python的rand…

    2025年12月14日
    000
  • 使用 Python QuickFIX 通过 Stunnel 连接

    本文档旨在指导开发者如何使用 Python QuickFIX 库通过 Stunnel 建立安全的 FIX (Financial Information eXchange) 连接。我们将详细介绍 Stunnel 的配置,QuickFIX 应用程序的设置,并提供调试技巧,以解决连接断开等常见问题,确保 …

    2025年12月14日
    000
  • python序列解包的使用

    序列解包可将可迭代对象元素赋值给多个变量,支持元组、列表、字符串等;使用*可接收多余元素,适用于不定长数据;支持嵌套解包及函数参数传递,提升代码可读性与效率。 Python中的序列解包是一种简洁高效的操作,能将序列或可迭代对象中的元素直接赋值给多个变量。只要右侧的对象是可迭代的,比如列表、元组、字符…

    2025年12月14日
    000
  • 在 Pandas DataFrame 中基于条件判断创建新列

    本文将介绍如何使用 Python 的 Pandas 库在 DataFrame 中基于现有列的条件判断创建新的列。我们将通过 .loc 方法,结合条件表达式,高效地为新列赋值。同时,我们将展示如何优化代码,避免冗余判断,使代码更加简洁易懂。通过本文的学习,你将掌握在数据分析中常用的条件列创建技巧。 使…

    2025年12月14日
    000
  • python如何删除目录

    删除目录需根据是否为空选择方法:1. 空目录用os.rmdir()或Path().rmdir();2. 非空目录用shutil.rmtree();3. 推荐先用os.path.exists()检查存在性,避免异常,提升程序健壮性。 在 Python 中删除目录有多种方式,主要取决于目录是否为空。以下…

    2025年12月14日
    000
  • Python 模块导入与文档字符串丢失问题详解

    本文旨在解释 Python 中模块导入后可能导致文件文档字符串(docstring)丢失的现象。通过分析导入位置与文档字符串的关系,结合 PEP 8 规范,帮助开发者理解并避免此类问题,确保代码文档的完整性和可读性。 在 Python 中,文档字符串(docstring)是用于为模块、类、函数或方法…

    2025年12月14日
    000
  • 使用 Python QuickFIX 通过 Stunnel 建立安全连接

    本文档旨在指导开发者如何使用 Python QuickFIX 库通过 Stunnel 建立安全的 FIX 消息连接。我们将详细介绍 Stunnel 的配置,QuickFIX 应用程序的设置,以及如何调试可能出现的问题,确保 FIX 消息能够安全可靠地传输。本文档适用于需要在非安全网络中传输 FIX …

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信