Pandas通过read_excel和to_excel方法实现Excel读写,需安装pandas、openpyxl等库;可指定工作表、跳过行、解析日期,支持多表读取与写入,结合DataFrame操作完成数据处理。

使用Pandas处理Excel文件非常方便,主要依赖于pandas.read_excel()和df.to_excel()两个核心方法。只要安装好相关库,就能轻松读取和写入Excel数据。
安装与环境准备
Pandas本身不直接支持Excel格式,需要额外安装引擎:
安装pandas:pip install pandas 读取.xlsx文件需要openpyxl:pip install openpyxl 如果要读写旧版.xls文件,可安装xlrd:pip install xlrd
确保版本兼容,尤其是处理xlsx文件时,推荐使用较新版本的openpyxl。
读取Excel文件
使用pd.read_excel()可以将Excel数据加载为DataFrame:
基础用法:df = pd.read_excel(“data.xlsx”) —— 默认读取第一个工作表 指定工作表:pd.read_excel(“data.xlsx”, sheet_name=”Sheet2″) 通过索引选表:pd.read_excel(“data.xlsx”, sheet_name=0) 读多个表:pd.read_excel(“data.xlsx”, sheet_name=[“Sheet1”, “Sheet2”]) 返回字典 跳过行或设置列名:pd.read_excel(“data.xlsx”, skiprows=2, usecols=”A:D”)
注意:如果第一行不是标题,可以设置header=None,让Pandas自动生成列名。
处理数据
读入数据后,就可以用Pandas进行各种操作:
查看前几行:df.head() 检查数据类型:df.dtypes 处理缺失值:df.dropna() 或 df.fillna(0) 筛选数据:df[df[“销售额”] > 1000] 添加新列:df[“利润率”] = df[“利润”] / df[“销售额”]
Excel中常见的日期列,Pandas可通过parse_dates参数自动识别:
pd.read_excel(“data.xlsx”, parse_dates=[“日期”])
写入Excel文件
处理完数据后,可以用to_excel()保存结果:
基本保存:df.to_excel(“output.xlsx”, index=False) —— 建议关闭index避免多余列 写入特定工作表:df.to_excel(“output.xlsx”, sheet_name=”处理结果”, index=False) 多个表写入一个文件:
需使用pd.ExcelWriter:
with pd.ExcelWriter(“report.xlsx”) as writer:
df1.to_excel(writer, sheet_name=”汇总”, index=False)
df2.to_excel(writer, sheet_name=”明细”, index=False)
基本上就这些。读、处理、写三步走,配合openpyxl等引擎,Pandas能高效完成大多数Excel数据任务。关键是熟悉参数,避免格式错乱或数据丢失。
以上就是如何使用Pandas处理Excel?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1382420.html
微信扫一扫
支付宝扫一扫