Pandas CSV转XLSX后时间数据丢失了,如何解决?

pandas csv转xlsx后时间数据丢失了,如何解决?

Pandas处理CSV转XLSX后时间数据丢失问题

在使用Pandas将CSV文件转换为XLSX文件时,经常会遇到时间列数据丢失,变成NaN值的情况。本文将提供一种有效的解决方法

问题通常出现在使用pd.read_csv读取包含时间列的CSV文件,再用pd.to_excel保存为XLSX文件后。再次读取XLSX文件时,时间列数据变成了NaN。

根本原因在于Pandas在默认情况下无法正确识别XLSX文件中的时间数据格式。虽然CSV文件中的时间格式正确,但保存为XLSX后,Pandas可能无法自动识别,导致读取错误。

解决方法是:在读取XLSX文件时,显式指定时间列并进行日期时间解析。 利用pd.read_excel函数的parse_dates参数指定需要解析为日期时间的列,并使用date_parser参数自定义日期时间解析函数。

以下代码演示了如何解决这个问题:

df = pd.read_excel('output.xlsx', parse_dates=['审核入库时间列'], date_parser=lambda x: pd.to_datetime(x, format='%Y-%m-%d %H:%M:%S'))

代码中,parse_dates=['审核入库时间列'] 指定了需要解析为日期时间的列名(请根据实际列名修改)。date_parser=lambda x: pd.to_datetime(x, format='%Y-%m-%d %H:%M:%S') 定义了一个匿名函数,使用pd.to_datetime将读取的字符串数据转换为日期时间对象,并指定了日期时间格式为'%Y-%m-%d %H:%M:%S'。 请根据您的实际时间格式调整format参数。

通过此方法,您可以正确读取XLSX文件中的时间数据,避免NaN值的出现。

以上就是Pandas CSV转XLSX后时间数据丢失了,如何解决?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1359190.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 22:30:34
下一篇 2025年12月13日 17:22:29

相关推荐

发表回复

登录后才能评论
关注微信