如何使用Python操作Excel?openpyxl库高级技巧指南

openpyxl是python操作excel的核心库,支持读取、写入和修改文件。使用load_workbook()读取,workbook()创建新文件,save()保存修改。通过sheet[“a1”].value读取单元格内容,append()添加行数据。样式可通过font、alignment、patternfill等类设置。处理大型文件时,应启用read_only或write_only模式,配合iter_rows()限制读取范围以优化性能。日期时间数据会自动转换为datetime对象,写入时若格式异常可设置number_format属性。此外,避免频繁样式设置、减少公式使用、及时释放资源及考虑使用pandas辅助处理均可提升效率。

如何使用Python操作Excel?openpyxl库高级技巧指南

使用Python操作Excel,关键在于openpyxl库。它允许你读取、写入和修改Excel文件,而高级技巧则集中在更高效的数据处理、样式定制和公式应用上。

如何使用Python操作Excel?openpyxl库高级技巧指南

解决方案:

安装 openpyxl:

立即学习“Python免费学习笔记(深入)”;

如何使用Python操作Excel?openpyxl库高级技巧指南

pip install openpyxl

读取Excel文件:

from openpyxl import load_workbookworkbook = load_workbook(filename="example.xlsx")sheet = workbook.active  # 或者 workbook["Sheet1"]cell_value = sheet["A1"].valueprint(cell_value)# 遍历所有行for row in sheet.iter_rows(min_row=2, max_row=5, min_col=1, max_col=3, values_only=True):    print(row)

写入Excel文件:

如何使用Python操作Excel?openpyxl库高级技巧指南

from openpyxl import Workbookworkbook = Workbook()sheet = workbook.activesheet["A1"] = "Hello"sheet["B1"] = 42# 添加一行数据sheet.append(["World", 99])workbook.save(filename="output.xlsx")

修改Excel文件:

直接通过单元格坐标修改,然后保存。

样式定制:

from openpyxl.styles import Font, Color, Alignment, PatternFillcell = sheet["A1"]cell.font = Font(name="Arial", size=12, bold=True, color="FF0000")  # 红色加粗Arial字体cell.alignment = Alignment(horizontal="center", vertical="center")cell.fill = PatternFill(start_color="FFFF0000", end_color="FFFF0000", fill_type="solid") #红色背景

公式应用:

sheet["C1"] = "=SUM(A1:B1)"

处理大型Excel文件:

使用read_only=Truewrite_only=True模式,配合迭代器,可以显著降低内存占用

openpyxl有哪些常用的函数和方法?

工作簿(Workbook)操作:

load_workbook(filename): 加载现有Excel文件。Workbook(): 创建新的Excel文件。save(filename): 保存Excel文件。create_sheet(title=None, index=None): 创建新的工作表。remove(worksheet): 删除工作表。sheetnames: 获取所有工作表名称的列表。

工作表(Worksheet)操作:

title: 获取或设置工作表的标题。active: 获取活动工作表。iter_rows(min_row=None, max_row=None, min_col=None, max_col=None, values_only=False): 迭代指定范围内的行。values_only=True 可以只获取单元格的值。iter_cols(min_col=None, max_col=None, min_row=None, max_row=None, values_only=False): 迭代指定范围内的列。append(iterable): 在工作表的末尾添加一行数据。merge_cells(range_string): 合并单元格。unmerge_cells(range_string): 取消合并单元格。row_dimensions[row_number]: 获取或设置行的属性(例如,高度)。column_dimensions[column_letter]: 获取或设置列的属性(例如,宽度)。

单元格(Cell)操作:

value: 获取或设置单元格的值。row: 获取单元格所在的行号。column: 获取单元格所在的列号(数字)。column_letter: 获取单元格所在的列字母。coordinate: 获取单元格的坐标(例如,”A1″)。font: 获取或设置单元格的字体样式。fill: 获取或设置单元格的填充样式。alignment: 获取或设置单元格的对齐方式。number_format: 获取或设置单元格的数字格式。border: 获取或设置单元格的边框样式。

样式(Style)操作:

Font(name=None, size=None, bold=None, italic=None, color=None): 创建字体样式。PatternFill(fill_type=None, fgColor=None, bgColor=None): 创建填充样式。Alignment(horizontal=None, vertical=None, wrap_text=None): 创建对齐方式。Border(left=None, right=None, top=None, bottom=None): 创建边框样式。Side(style=None, color=None): 创建边框的边。Color(rgb=None): 创建颜色。

如何处理Excel中的日期和时间数据?

openpyxl 会自动将Excel中的日期和时间值转换为Python的datetime对象。

from openpyxl import load_workbookfrom datetime import datetimeworkbook = load_workbook(filename="dates.xlsx")sheet = workbook.activedate_value = sheet["A1"].valueif isinstance(date_value, datetime):    print(date_value.strftime("%Y-%m-%d"))  # 格式化日期else:    print("Not a datetime object")#写入日期from openpyxl import Workbookfrom datetime import datetimewb = Workbook()ws = wb.activews['A1'] = datetime(2024, 1, 1)wb.save("date_written.xlsx")

如果你需要将Python的datetime对象写入Excel,openpyxl会自动处理。 如果遇到日期显示不正确的情况,可能是Excel单元格的格式问题,可以在Excel中手动修改单元格的格式,或者使用openpyxl设置单元格的number_format属性。

如何优化openpyxl的性能,处理大型Excel文件?

使用 read_onlywrite_only 模式: 当处理大型文件时,使用只读或只写模式可以显著减少内存占用。

from openpyxl import load_workbookworkbook = load_workbook(filename="large_file.xlsx", read_only=True)for sheet_name in workbook.sheetnames:    sheet = workbook[sheet_name]    for row in sheet.iter_rows(max_row=100): #限制读取的行数        for cell in row:            print(cell.value)

对于写入:

from openpyxl import Workbookworkbook = Workbook(write_only=True)sheet = workbook.create_sheet()for i in range(1000):    row = [i, i * 2, i * 3]    sheet.append(row)workbook.save("large_output.xlsx")

使用迭代器: iter_rows()iter_cols() 方法允许你按行或按列迭代数据,而不是一次性加载整个工作表到内存中。

限制读取的范围: 使用 min_row, max_row, min_col, max_col 参数来限制读取的数据范围。

避免不必要的样式设置: 样式设置会增加内存占用和处理时间。尽量减少样式的使用,或者只在必要时应用样式。

使用公式时注意: 大量公式计算可能会影响性能。考虑是否可以在Python中预先计算结果,然后将结果写入Excel。

及时释放资源: 在处理完工作簿后,确保关闭文件,释放资源。

使用更高效的库(如果适用): 对于非常大的文件,可以考虑使用其他更底层的库,例如csvpandas,然后将数据导出到Excel。 pandas 在处理数据方面通常比直接使用 openpyxl 更高效。

以上就是如何使用Python操作Excel?openpyxl库高级技巧指南的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1364587.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 04:07:13
下一篇 2025年12月14日 04:07:26

相关推荐

  • Python如何处理卫星云图?netCDF4库指南

    卫星云图数据常用netcdf格式,因其自描述性、多维数组支持和跨平台特性。1. netcdf是自描述格式,包含变量名、单位、维度等元信息,便于数据共享与长期存储;2. 它天然支持多维数组,能高效组织时间序列、不同光谱通道及垂直层的复杂数据;3. 该格式具备机器无关性,确保在不同系统间无缝读取,利于跨…

    2025年12月14日 好文分享
    000
  • 在Python中将RGB颜色量化为最接近的ANSI颜色码

    本教程详细阐述了如何在Python中将任意RGB颜色值转换为最接近的有限ANSI控制台颜色码。通过构建一个预定义的ANSI颜色调色板,并利用欧几里得距离计算法,我们能够有效地量化图像或数据中的RGB颜色,从而实现在字符终端中显示近似色彩的目的。文章提供了详细的代码示例和实现步骤,帮助读者理解并应用这…

    2025年12月14日
    000
  • 将RGB颜色转换为最接近的ANSI控制台颜色:基于欧几里得距离的量化方法

    将RGB颜色转换为最接近的ANSI控制台颜色:基于欧几里得距离的量化方法 本文详细介绍了如何在python中将任意rgb颜色值转换为最接近的ansi控制台颜色。鉴于控制台颜色显示能力的限制,该过程通常涉及颜色量化。核心方法是利用欧几里得距离计算给定rgb颜色与预定义ansi颜色调色板中每种颜色的相似…

    2025年12月14日
    000
  • 使用 SymPy 求解最大公约数线性组合:gcdex 函数详解

    本文旨在解决在 Python 中将两个整数的最大公约数(GCD)表示为它们线性组合的问题,即找到整数 x 和 y 使得 ax + by = gcd(a, b)。我们将探讨为何普通的代数简化方法不适用此场景,并详细介绍 SymPy 库中专门用于此目的的 gcdex 函数,通过实例演示其用法和输出解读,…

    2025年12月14日
    000
  • 利用SymPy简化表达式并求解线性不定方程

    本文旨在探讨如何使用Python中的SymPy库,特别是gcdex函数,来简化涉及线性不定方程的表达式。通过扩展欧几里得算法,gcdex函数能够高效地找到满足ax + by = gcd(a, b)形式的整数解x和y,从而为求解线性不定方程提供关键的特解。文章将通过具体示例,详细阐述gcdex的用法、…

    2025年12月14日
    000
  • Kivy KV语言中的类命名规范:解决嵌套组件不显示问题

    本文深入探讨了Kivy框架中一个常见的布局问题:当自定义Kivy组件在KV语言中被嵌套使用时,如果其类名不遵循特定的命名规范(即首字母大写),可能导致子组件无法正确渲染。文章将详细解释这一现象的原因,并提供正确的类命名实践,通过示例代码展示如何修正此类问题,确保Kivy应用的布局和组件能够按预期显示…

    2025年12月14日
    000
  • Kivy KV语言与Python类命名约定:解决嵌套组件不显示问题

    本文深入探讨Kivy应用中,自定义组件在ScreenManager内无法正确渲染的常见问题。通过分析Kivy KV语言的命名解析机制,揭示了Python类命名规范(首字母大写)对KV文件正确识别和加载组件的重要性。文章提供了详细的示例代码,并指导开发者如何遵循Kivy约定,确保嵌套组件的正常显示与应…

    2025年12月14日
    000
  • Python列表引用与循环结构:深度解析可变类型与内存机制

    本文深入探讨Python中列表的别名、嵌套与循环引用行为。通过剖析可变(mutable)与不可变(immutable)数据类型在内存管理上的差异,强调Python变量存储的是对象引用而非值本身。文章通过具体代码示例,详细解释了列表如何通过引用机制形成相互包含的递归结构,以及这种底层机制如何影响数据的…

    2025年12月14日
    000
  • 深入理解Python列表引用、可变性与递归结构

    Python中变量并非直接存储值,而是持有指向内存中对象的引用。理解可变(如列表)与不可变(如字符串)数据类型的行为至关重要:修改不可变对象会创建新对象,而修改可变对象则在原内存地址上进行。当列表包含其他对象时,它存储的是这些对象的引用,而非副本。这种引用机制导致了别名现象,甚至能形成列表间相互引用…

    2025年12月14日
    000
  • Python列表的引用、可变性与循环引用行为详解

    本教程深入探讨Python中列表(list)的引用机制、可变数据类型特性以及由此引发的别名(aliasing)和循环引用行为。通过详细的代码示例,解释了变量如何存储内存地址而非直接值,以及可变与不可变对象在修改时的不同表现。文章特别剖析了列表之间相互引用的复杂场景,揭示了[…]输出背后的…

    2025年12月14日
    000
  • Python中列表别名、可变性与循环引用深度解析

    本文深入探讨Python中列表的别名、可变数据类型特性以及由此产生的循环引用现象。通过剖析字符串(不可变)和列表(可变)在内存中的存储与引用机制,揭示变量赋值和列表元素添加的本质是引用传递。文章结合具体代码示例,详细解释了列表如何通过相互引用形成“递归”结构,以及理解这一机制对于避免程序中潜在的副作…

    2025年12月14日
    000
  • Python对象引用、可变性与列表递归行为深度解析

    本文深入探讨Python中变量赋值、列表操作背后的内存机制,重点阐述可变与不可变数据类型的概念,以及对象引用(指针)的工作原理。通过实际代码示例,详细解析列表别名(aliasing)现象,特别是当列表相互引用时如何形成递归结构,并解释了这种行为对程序状态的影响,帮助读者理解Python数据模型的精髓…

    2025年12月14日
    000
  • Python Tkinter 面向对象设计:跨类获取游戏对象坐标的策略

    本教程探讨了在Python Tkinter面向对象游戏开发中,如何解决不同类之间对象坐标获取的问题。文章提供了两种核心策略:通过构造函数传递对象引用,以及通过方法参数传递对象引用。通过详细的代码示例和分析,帮助开发者理解并选择合适的跨对象通信机制,以实现如碰撞检测等功能,提升代码的可维护性和灵活性。…

    2025年12月14日
    000
  • 如何使用Python加速数据IO—parquet格式优化

    使用parquet提升python数据io效率的关键在于其列式存储结构和高效压缩特性。1. parquet按需读取特定列,节省内存和时间;2. 使用pyarrow读写parquet减少序列化开销,推荐snappy或gzip压缩;3. 分区存储按分类维度划分数据,减少查询时的io开销;4. 控制列数量…

    2025年12月14日 好文分享
    000
  • 怎样用Python操作Ceph?分布式存储连接

    python操作ceph最常用的方式是使用rados库操作rados层或使用boto3对接rgw的s3兼容api;2. rados库用于底层存储池和对象操作,依赖ceph客户端库并需配置ceph.conf和keyring;3. boto3通过endpoint_url对接ceph rgw,适合构建云原…

    2025年12月14日 好文分享
    000
  • Python怎样实现图像识别?OpenCV深度学习应用教程

    1.数据是图像识别的基础,必须收集大量标注数据;2.根据任务类型选择模型,分类任务用resnet、vgg,检测任务用yolo、ssd,分割任务用u-net、mask r-cnn;3.考虑资源限制,边缘设备优先选用mobilenet、shufflenet等轻量级模型;4.数据不足时采用迁移学习结合预训…

    2025年12月14日 好文分享
    000
  • Python如何实现自动化测试?Selenium框架详细使用教程

    selenium webdriver的安装与基本配置步骤如下:首先,确保已安装python和pip;其次,通过pip install selenium命令安装selenium库;然后,根据目标浏览器下载对应的webdriver(如chromedriver、geckodriver等),并确认其版本与浏…

    2025年12月14日 好文分享
    000
  • Python如何计算移动平均值?rolling函数使用教程

    在python中计算移动平均值最常用的方法是使用pandas库的rolling函数。1. 导入pandas和numpy;2. 创建一个series或dataframe;3. 使用rolling函数并指定window参数来定义窗口大小;4. 调用mean()方法计算移动平均值;5. 可通过设置min_…

    2025年12月14日 好文分享
    000
  • 递归实现西 Syracuse 序列的 Python 函数教程

    Syracuse 序列(也称为冰雹序列或 Collat​​z 序列)是一个有趣的数学概念,它基于一个简单的规则:对于任何正整数 n,如果 n 是偶数,则将其除以 2;如果 n 是奇数,则将其乘以 3 再加 1。重复此过程,直到 n 变为 1。本教程将探讨如何使用 Python 递归函数有效地生成 S…

    2025年12月14日
    000
  • Pygame屏幕滚动与像素环绕问题:高效地生成和管理动态地形

    本文深入探讨Pygame中实现屏幕水平滚动时常见的像素环绕问题,并提供一套有效的解决方案。通过在滚动后填充新暴露的区域,可以避免旧像素的重复显示,实现流畅的无缝滚动效果。文章还将介绍如何利用数据结构管理地形,并探讨玩家与动态地形的交互及碰撞检测策略,旨在帮助开发者构建更专业、更具交互性的游戏场景。 …

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信