
pandas 读取所有 xlsx 文件时出现“excel 文件格式无法确定”错误
在使用 pandas 从文件夹中读取所有 xlsx 文件时,可能会遇到如下错误:
excel file format cannot be determined, you must specify an engine manually.
根源
此错误通常是由 ms excel 创建的隐藏临时文件引起的,这些文件会在打开 excel 文件时在同一目录中创建,文件名格式为:
~$datasheet.xlsx
解决方案
为了避免此错误,可以:
关闭所有 excel 文件后运行代码:确保在运行代码读取文件之前关闭所有打开的 excel 文件。
手动指定引擎:使用 engine 参数指定引擎,例如 openpyxl,如下所示:
df = pd.read_excel(f, engine="openpyxl")
注意事项
使用 openpyxl 引擎可能会导致另一个错误:“badzipfile: file is not a zip file”。这是因为 pandas 的旧版本(
以上就是如何解决 Pandas 读取 XLSX 文件出现的“Excel 文件格式无法确定”错误?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1352430.html
微信扫一扫
支付宝扫一扫