python中如何操作Excel文件_Python使用openpyxl/pandas操作Excel

使用openpyxl和pandas操作Excel:openpyxl适合精细格式控制,pandas擅长数据分析;读写大型文件时可采用只读/只写模式或分块处理以提升性能。

python中如何操作excel文件_python使用openpyxl/pandas操作excel

Python操作Excel文件,简单来说,就是用代码读写Excel表格。两种常用的库是

openpyxl

pandas

openpyxl

更底层,适合精细控制格式;

pandas

则更适合数据分析和处理,简单粗暴。

解决方案

使用

openpyxl

安装:

pip install openpyxl

立即学习“Python免费学习笔记(深入)”;

读取:

from openpyxl import load_workbook# 加载工作簿workbook = load_workbook(filename="example.xlsx")# 选择工作表sheet = workbook["Sheet1"]  # 或者 workbook.active 获取活动工作表# 读取单元格数据cell_value = sheet["A1"].valueprint(cell_value)# 循环读取行for row in sheet.iter_rows(min_row=2, max_row=5, min_col=1, max_col=3):    for cell in row:        print(cell.value)
iter_rows

可以方便地按行读取数据,指定起始和结束的行/列。 注意,

openpyxl

的索引是从1开始的,不是从0开始的。 一开始用的时候,经常搞错。

写入:

from openpyxl import Workbook# 创建一个新的工作簿workbook = Workbook()# 选择工作表sheet = workbook.active# 写入单元格数据sheet["A1"] = "Hello"sheet["B2"] = 123# 保存工作簿workbook.save(filename="new_example.xlsx")

写入数据非常直接,直接赋值即可。 创建新的工作簿也很简单。

格式设置:

openpyxl

提供了丰富的格式设置选项,比如字体、颜色、对齐方式等。 这部分比较繁琐,需要查阅文档。

使用

pandas

安装:

pip install pandas

读取:

import pandas as pd# 读取Excel文件df = pd.read_excel("example.xlsx", sheet_name="Sheet1")# 打印DataFrameprint(df)# 获取特定列column_data = df["Column1"]print(column_data)
read_excel

函数非常强大,可以读取指定的工作表,还可以指定行索引、列索引等。 返回的是一个DataFrame对象,方便进行数据分析。

写入:

import pandas as pd# 创建一个DataFramedata = {"Name": ["Alice", "Bob", "Charlie"], "Age": [25, 30, 28]}df = pd.DataFrame(data)# 写入Excel文件df.to_excel("new_example.xlsx", sheet_name="Sheet1", index=False)
to_excel

函数可以将DataFrame写入Excel文件。

index=False

表示不写入行索引。

pandas

写入excel,在处理大型数据集时会非常高效。

openpyxl

pandas

,我该选哪个?

选择哪个库取决于你的具体需求。 如果你需要精细控制Excel的格式,或者处理一些特殊的需求,比如合并单元格、插入图片等,那么

openpyxl

更适合你。 如果你主要是进行数据分析和处理,那么

pandas

更方便快捷。

pandas

的DataFrame对象提供了丰富的数据处理方法,可以方便地进行数据清洗、转换、分析等操作。

如何处理Excel中的日期格式?

在用

openpyxl

读取Excel文件时,日期会被读取成datetime对象。

from openpyxl import load_workbookfrom datetime import datetimeworkbook = load_workbook(filename="example_with_dates.xlsx")sheet = workbook.activedate_value = sheet["A1"].valueif isinstance(date_value, datetime):    print(date_value.strftime("%Y-%m-%d")) # 格式化日期else:    print(date_value)

pandas

读取时,默认也会尝试将日期识别为datetime对象。 如果读取失败,可以手动指定

parse_dates

参数。

import pandas as pddf = pd.read_excel("example_with_dates.xlsx", parse_dates=["DateColumn"]) # DateColumn 是包含日期的列名print(df["DateColumn"].dtype) # 确认是否为datetime64[ns]

如何优化Excel文件读写速度?

对于大型Excel文件,读写速度是一个需要考虑的问题。

openpyxl

可以使用

read_only

write_only

模式来提高读写速度。

read_only

模式只能读取数据,不能修改数据;

write_only

模式只能写入数据,不能读取数据。

from openpyxl import load_workbook# 只读模式workbook = load_workbook(filename="large_file.xlsx", read_only=True)sheet = workbook.activefor row in sheet.rows:    for cell in row:        print(cell.value)# 只写模式from openpyxl import Workbookworkbook = Workbook(write_only=True)sheet = workbook.create_sheet()for i in range(1000):    row = [i] * 10    sheet.append(row)workbook.save("large_file_write_only.xlsx")

pandas

可以使用

chunksize

参数来分块读取数据。 这样可以避免一次性将整个文件加载到内存中,从而提高读取速度。

import pandas as pdfor chunk in pd.read_excel("large_file.xlsx", chunksize=1000):    print(chunk.head()) # 处理每一块数据

另外,尽量避免在循环中频繁地读写单元格,可以将数据先存储到内存中,然后一次性写入Excel文件。

以上就是python中如何操作Excel文件_Python使用openpyxl/pandas操作Excel的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1370790.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 10:51:09
下一篇 2025年12月14日 10:51:29

相关推荐

发表回复

登录后才能评论
关注微信