openpyxl是python操作excel的核心库,支持读取、写入和修改文件。使用load_workbook()读取,workbook()创建新文件,save()保存修改。通过sheet[“a1”].value读取单元格内容,append()添加行数据。样式可通过font、alignment、patternfill等类设置。处理大型文件时,应启用read_only或write_only模式,配合iter_rows()限制读取范围以优化性能。日期时间数据会自动转换为datetime对象,写入时若格式异常可设置number_format属性。此外,避免频繁样式设置、减少公式使用、及时释放资源及考虑使用pandas辅助处理均可提升效率。

使用Python操作Excel,关键在于openpyxl库。它允许你读取、写入和修改Excel文件,而高级技巧则集中在更高效的数据处理、样式定制和公式应用上。

解决方案:
安装 openpyxl:
立即学习“Python免费学习笔记(深入)”;

pip install openpyxl
读取Excel文件:
from openpyxl import load_workbookworkbook = load_workbook(filename="example.xlsx")sheet = workbook.active # 或者 workbook["Sheet1"]cell_value = sheet["A1"].valueprint(cell_value)# 遍历所有行for row in sheet.iter_rows(min_row=2, max_row=5, min_col=1, max_col=3, values_only=True): print(row)
写入Excel文件:

from openpyxl import Workbookworkbook = Workbook()sheet = workbook.activesheet["A1"] = "Hello"sheet["B1"] = 42# 添加一行数据sheet.append(["World", 99])workbook.save(filename="output.xlsx")
修改Excel文件:
直接通过单元格坐标修改,然后保存。
样式定制:
from openpyxl.styles import Font, Color, Alignment, PatternFillcell = sheet["A1"]cell.font = Font(name="Arial", size=12, bold=True, color="FF0000") # 红色加粗Arial字体cell.alignment = Alignment(horizontal="center", vertical="center")cell.fill = PatternFill(start_color="FFFF0000", end_color="FFFF0000", fill_type="solid") #红色背景
公式应用:
sheet["C1"] = "=SUM(A1:B1)"
处理大型Excel文件:
使用read_only=True和write_only=True模式,配合迭代器,可以显著降低内存占用。
openpyxl有哪些常用的函数和方法?
工作簿(Workbook)操作:
load_workbook(filename): 加载现有Excel文件。Workbook(): 创建新的Excel文件。save(filename): 保存Excel文件。create_sheet(title=None, index=None): 创建新的工作表。remove(worksheet): 删除工作表。sheetnames: 获取所有工作表名称的列表。
工作表(Worksheet)操作:
title: 获取或设置工作表的标题。active: 获取活动工作表。iter_rows(min_row=None, max_row=None, min_col=None, max_col=None, values_only=False): 迭代指定范围内的行。values_only=True 可以只获取单元格的值。iter_cols(min_col=None, max_col=None, min_row=None, max_row=None, values_only=False): 迭代指定范围内的列。append(iterable): 在工作表的末尾添加一行数据。merge_cells(range_string): 合并单元格。unmerge_cells(range_string): 取消合并单元格。row_dimensions[row_number]: 获取或设置行的属性(例如,高度)。column_dimensions[column_letter]: 获取或设置列的属性(例如,宽度)。
单元格(Cell)操作:
value: 获取或设置单元格的值。row: 获取单元格所在的行号。column: 获取单元格所在的列号(数字)。column_letter: 获取单元格所在的列字母。coordinate: 获取单元格的坐标(例如,”A1″)。font: 获取或设置单元格的字体样式。fill: 获取或设置单元格的填充样式。alignment: 获取或设置单元格的对齐方式。number_format: 获取或设置单元格的数字格式。border: 获取或设置单元格的边框样式。
样式(Style)操作:
Font(name=None, size=None, bold=None, italic=None, color=None): 创建字体样式。PatternFill(fill_type=None, fgColor=None, bgColor=None): 创建填充样式。Alignment(horizontal=None, vertical=None, wrap_text=None): 创建对齐方式。Border(left=None, right=None, top=None, bottom=None): 创建边框样式。Side(style=None, color=None): 创建边框的边。Color(rgb=None): 创建颜色。
如何处理Excel中的日期和时间数据?
openpyxl 会自动将Excel中的日期和时间值转换为Python的datetime对象。
from openpyxl import load_workbookfrom datetime import datetimeworkbook = load_workbook(filename="dates.xlsx")sheet = workbook.activedate_value = sheet["A1"].valueif isinstance(date_value, datetime): print(date_value.strftime("%Y-%m-%d")) # 格式化日期else: print("Not a datetime object")#写入日期from openpyxl import Workbookfrom datetime import datetimewb = Workbook()ws = wb.activews['A1'] = datetime(2024, 1, 1)wb.save("date_written.xlsx")
如果你需要将Python的datetime对象写入Excel,openpyxl会自动处理。 如果遇到日期显示不正确的情况,可能是Excel单元格的格式问题,可以在Excel中手动修改单元格的格式,或者使用openpyxl设置单元格的number_format属性。
如何优化openpyxl的性能,处理大型Excel文件?
使用 read_only 和 write_only 模式: 当处理大型文件时,使用只读或只写模式可以显著减少内存占用。
from openpyxl import load_workbookworkbook = load_workbook(filename="large_file.xlsx", read_only=True)for sheet_name in workbook.sheetnames: sheet = workbook[sheet_name] for row in sheet.iter_rows(max_row=100): #限制读取的行数 for cell in row: print(cell.value)
对于写入:
from openpyxl import Workbookworkbook = Workbook(write_only=True)sheet = workbook.create_sheet()for i in range(1000): row = [i, i * 2, i * 3] sheet.append(row)workbook.save("large_output.xlsx")
使用迭代器: iter_rows() 和 iter_cols() 方法允许你按行或按列迭代数据,而不是一次性加载整个工作表到内存中。
限制读取的范围: 使用 min_row, max_row, min_col, max_col 参数来限制读取的数据范围。
避免不必要的样式设置: 样式设置会增加内存占用和处理时间。尽量减少样式的使用,或者只在必要时应用样式。
使用公式时注意: 大量公式计算可能会影响性能。考虑是否可以在Python中预先计算结果,然后将结果写入Excel。
及时释放资源: 在处理完工作簿后,确保关闭文件,释放资源。
使用更高效的库(如果适用): 对于非常大的文件,可以考虑使用其他更底层的库,例如csv 或 pandas,然后将数据导出到Excel。 pandas 在处理数据方面通常比直接使用 openpyxl 更高效。
以上就是如何使用Python操作Excel?openpyxl库高级技巧指南的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1364587.html
微信扫一扫
支付宝扫一扫