解决 Pandas 中时间解析错误:hour must be in 0..23

解决 pandas 中时间解析错误:hour must be in 0..23

本文旨在解决在使用 Pandas 处理包含分钟:秒格式时间数据时,遇到的 dateutil.parser._parser.ParserError: hour must be in 0..23 错误。文章将分析错误原因,并提供可行的解决方案,将时间数据转换为合适的 Pandas 时间序列格式。

问题分析

当 Pandas 尝试将字符串转换为日期时间对象时,如果字符串的格式与日期时间格式不匹配,则会引发 dateutil.parser._parser.ParserError 错误。 在本例中,错误信息 hour must be in 0..23 表明 Pandas 尝试将 time 列中的值解析为包含小时的完整时间戳,但列中的数据实际上是分钟:秒的格式,其中某些值(如 ’59:23.4’)的小时部分大于 23,导致解析失败。

解决方案

解决此问题的关键在于正确理解 time 列中数据的含义,并将其转换为合适的数据类型。 如果 time 列表示的是从某一时刻开始经过的时间(即持续时间),而不是一天中的特定时间点,则应该将其转换为 timedelta 对象。

以下是一种可行的解决方案:

import pandas as pd# 从 Google Drive 读取数据url = 'https://drive.google.com/uc?id=12R6nMvN81GJHSBEElP8NiXXkwtuv04wf'  # 替换为你的文件 IDdf = pd.read_csv(url)# 定义一个函数,将 "MM:SS.f" 格式的字符串转换为 timedelta 对象def convert_to_timedelta(time_str):    try:        minutes, seconds = map(float, time_str.split(':'))        return pd.to_timedelta(minutes=minutes, seconds=seconds)    except:        return pd.NaT  # 处理无法解析的值# 将 "time" 列应用转换函数df['time'] = df['time'].astype(str).apply(convert_to_timedelta)# 打印转换后的数据类型和前几行数据print(df['time'].dtype)print(df['time'].head())

代码解释:

读取数据: 使用 pd.read_csv 从指定的 URL 读取 CSV 文件到 Pandas DataFrame 中。定义转换函数: convert_to_timedelta 函数接收一个字符串参数(时间),将其分割为分钟和秒,并使用 pd.to_timedelta 函数将其转换为 timedelta 对象。 如果字符串无法解析,则返回 pd.NaT (Not a Time)。应用转换函数: 使用 df[‘time’].apply(convert_to_timedelta) 将 convert_to_timedelta 函数应用到 DataFrame 的 time 列中的每个元素。 astype(str) 确保输入为字符串,避免潜在的类型错误。检查结果: 打印 time 列的数据类型,确认其已成功转换为 timedelta64[ns]。 打印前几行数据,以验证转换的正确性。

注意事项

数据清洗: 在转换之前,应确保 time 列中的数据格式一致,并处理缺失值或无效值。 例如,可以使用 df[‘time’] = df[‘time’].str.strip() 去除字符串前后的空格。

错误处理: 在 convert_to_timedelta 函数中包含了 try…except 块,用于处理无法解析的时间字符串。 根据实际情况,可以修改此部分的代码,例如将无法解析的值替换为 0 或其他合适的值。

时区问题: 如果需要处理包含时区信息的时间数据,需要使用 tz_localize 和 tz_convert 方法进行时区转换。

格式化输出 如果需要将 timedelta 对象格式化为特定的字符串,可以使用 strftime 方法。例如:

print(df['time'].apply(lambda x: str(x)))

总结

解决 Pandas 中 dateutil.parser._parser.ParserError: hour must be in 0..23 错误的关键在于理解数据的实际含义,并选择合适的数据类型进行转换。 如果 time 列表示的是持续时间,则应将其转换为 timedelta 对象。 通过编写自定义的转换函数,可以灵活地处理各种时间格式,并将数据转换为 Pandas 可以处理的时间序列数据。

以上就是解决 Pandas 中时间解析错误:hour must be in 0..23的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1366816.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 06:53:32
下一篇 2025年12月14日 06:53:50

相关推荐

  • Python高效处理.txt文件中的数值数据

    本教程详细介绍了如何使用Python从结构化文本文件中提取数值并进行计算。我们将学习如何安全地读取文件、利用字符串分割技术(如split()方法)解析数据行,将提取的字符串转换为数值类型,并对每个数据组进行求和操作。通过实际代码示例,您将掌握处理类似数据格式的有效方法,确保文件操作的健壮性。 1. …

    2025年12月14日
    000
  • Python中解析结构化文本文件并计算数值总和的教程

    本教程将指导您如何使用Python处理结构化文本文件,特别是从包含混合字符串和数值的数据行中提取并计算数值总和。我们将探讨文件读取的最佳实践、字符串分割技巧以及数据类型转换,以实现对特定数据项的精确求和,并以清晰的代码示例进行演示。 在数据处理的日常工作中,我们经常需要从非结构化或半结构化的文本文件…

    2025年12月14日
    000
  • 使用Python处理带标签的文本数据并进行数值计算

    本文将指导您如何使用Python解析结构化文本文件,例如包含“标签: 数值列表”格式的数据。教程涵盖了文件的安全读取、逐行处理、字符串分割(通过冒号和逗号)、将字符串数值转换为整数以及最终的数值求和操作。通过本教程,您将掌握处理此类文本数据的核心技巧,实现高效的数据提取与计算。 在数据处理任务中,我…

    2025年12月14日
    000
  • SymPy表达式在Pydroid3终端与GUI中的美观显示策略

    本文探讨了在Pydroid3终端以及GUI环境中美观显示SymPy数学表达式的方法。针对init_printing在特定环境下可能失效的问题,详细介绍了如何利用sympy.pprint和sympy.pretty函数生成字符画形式的表达式,并探讨了在Tkinter等GUI界面中显示这些表达式的策略,以…

    2025年12月14日
    000
  • 针对PyTorch模型ONNX导出中动态控制流与可选输入的处理策略

    本文深入探讨了PyTorch模型在ONNX导出时,如何处理依赖于输入数据的动态控制流(如判断输入是否全零并据此改变行为)的挑战。文章解释了ONNX Tracer无法捕获Python条件语句的根本原因,并提供了使用TorchScript (torch.jit.script) 和 torch.compi…

    2025年12月14日
    000
  • Python源码实现视频帧转图片功能 基于Python源码的图像序列提取

    用python将视频拆解为图片的核心方法是使用opencv库逐帧读取并保存。1. 使用opencv的videocapture打开视频并逐帧读取,通过imwrite保存为图片;2. 可通过跳帧或调用ffmpeg提升大视频处理效率;3. 图像质量可通过jpeg或png参数控制,命名建议采用零填充格式确保…

    2025年12月14日 好文分享
    000
  • Tkinter应用中文件读写与数据去重策略优化

    本文旨在解决Tkinter应用中因文件读写模式不当导致的数据重复生成问题。我们将深入探讨a+文件模式下文件指针的行为,以及如何正确地读取、写入和去重数据。此外,还将推荐使用JSON等结构化数据格式来优化数据管理,提升系统的健壮性和可维护性,并提供相应的代码示例和最佳实践。 1. 问题分析:重复生成与…

    2025年12月14日
    000
  • Pandas中怎样实现数据的透视表分析?

    pandas中的透视表分析是通过pd.pivot_table()函数实现的,它支持按指定维度对数据进行汇总和聚合。其核心功能包括:1. 指定values、index、columns和aggfunc参数进行数据透视;2. 支持多重行索引和列索引,实现多维分析;3. 可使用多个聚合函数(如sum、mea…

    2025年12月14日 好文分享
    000
  • Python如何处理JSON格式数据?解析与转换

    python处理json数据的核心是使用内置json模块的四个主要函数。1. json.loads()将json字符串解析为python对象,适用于网络请求等场景。2. json.load()直接从文件解析json数据,比先读取文件内容再用loads更高效。3. json.dumps()将pytho…

    2025年12月14日 好文分享
    000
  • 如何使用Python处理XML?ElementTree解析

    elementtree是python处理xml的首选工具,因为它内置标准库,无需额外安装;api简洁直观,适合日常xml解析和生成需求;性能良好且功能够用。其核心流程包括:1. 解析xml数据,支持字符串或文件解析;2. 导航和查找元素,通过find、findall等方法实现遍历和查询;3. 修改数…

    2025年12月14日 好文分享
    000
  • Python递归遍历与结构化文本文件解析:以网络速度数据为例

    本文介绍如何使用Python递归遍历文件系统,并解析特定格式的文本文件。通过pathlib模块查找所有.txt文件,然后将每个文件按固定行数分块处理。重点展示如何从每块中提取网络下载和上传速度信息,并根据预设条件进行格式化输出。此方法适用于处理结构化日志或报告文件,实现高效的数据提取与分析。 在日常…

    2025年12月14日
    000
  • 使用Python递归解析日志文件中的特定性能数据

    本教程详细介绍了如何使用Python递归遍历指定目录下的所有TXT文件,并从中提取、解析网络下载与上传速度等特定性能数据。文章通过定义文件结构常量、实现文件内容分块、自定义数据解析与格式化函数,提供了一个高效且可扩展的解决方案,适用于处理具有一致结构的大量日志文件。 在日常系统维护或数据分析中,我们…

    2025年12月14日
    000
  • 使用 Python 递归处理结构化文本文件并提取特定数据

    本文详细介绍了如何使用 Python 递归遍历目录下的 .txt 文件,并高效地解析其中结构化的网络速度数据。通过将文件内容按固定行数分块处理,并结合专门的函数进行数据提取、类型转换和格式化输出,实现对下载和上传速度的精确分析与报告。该方法适用于处理具有一致内部结构的大量文本文件。 1. 问题背景与…

    2025年12月14日
    000
  • Python教程:递归解析分段日志文件中的性能数据

    本教程详细介绍了如何使用Python递归地遍历目录,解析结构化文本文件中的分段性能数据。通过定义固定行数的块,提取下载和上传速度信息,并根据预设条件进行格式化输出。内容涵盖文件查找、数据分块、信息提取与自定义格式化函数,适用于处理具有一致内部结构的多部分日志或报告文件,提供了一种高效、可维护的数据处…

    2025年12月14日
    000
  • Python处理学生成绩:从文件读取到统计分析

    本文档旨在提供一个Python程序,用于读取包含学生成绩信息的文本文件,计算综合成绩,并将结果写入新文件。同时,程序还将统计各分数段的学生人数,并计算班级平均分。通过本文,你将学习如何使用Python进行文件读写、数据处理和统计分析。 文件读取与数据解析 首先,我们需要从score1.txt文件中读…

    2025年12月14日
    000
  • Python处理学生成绩:从原始数据到统计分析的完整指南

    本文旨在提供一个全面的Python教程,指导读者如何读取包含学生学号、平时成绩和期末成绩的文本文件,计算总评成绩,并将结果写入新文件。同时,文章还将演示如何统计各分数段的学生人数,并计算班级平均分,旨在帮助读者掌握Python文件读写、数据处理和统计分析的基本技能。 1. 数据读取与解析 首先,我们…

    2025年12月14日
    000
  • 如何正确读取和处理文本文件中的数据并进行计算

    本文旨在帮助读者理解如何从文本文件中读取数据,进行数据处理和计算,并将结果写入新的文件。重点讲解了文本文件读取、数据分割、类型转换、字典创建、数据计算以及文件写入等关键步骤,并提供代码示例和注意事项,帮助读者避免常见的错误,从而实现高效的数据处理。 在处理文本文件中的数据时,经常需要读取文件内容,然…

    2025年12月14日
    000
  • 如何用Python操作Access数据库?pyodbc连接

    python连接access数据库主要使用pyodbc库,1.需安装pyodbc;2.构建包含数据库路径和驱动信息的连接字符串;3.使用try-except-finally处理连接与错误;4.通过cursor执行sql查询并处理结果;5.注意参数化查询防止sql注入;6.确保安装匹配版本的micro…

    2025年12月14日 好文分享
    000
  • Python列表数据检索:根据用户输入获取关联信息

    本教程详细介绍了如何在Python中根据用户输入,从包含成对数据的列表中高效检索并打印出对应的关联信息。文章重点阐述了正确的数据结构选择(如元组列表)、循环遍历、条件判断以及精确的元素索引方法,并提供了清晰的代码示例。此外,还探讨了使用字典作为更优解决方案的实践,以提升数据检索的效率和代码的可读性,…

    2025年12月14日
    000
  • Tkinter温度转换器开发指南:解决GUI事件处理与数据获取问题

    本文旨在解决Tkinter GUI应用中常见的用户输入数据获取时机问题,特别是如何正确处理Entry组件的输入。我们将探讨GUI事件循环的非阻塞特性,并演示如何通过事件绑定和模块化函数设计,实现响应式的温度转换器,确保在用户输入数据后才进行计算,并提供健壮的错误处理机制。 在开发图形用户界面(gui…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信