Pandas中将hh:mm:ss时间格式转换为总分钟数的教程

程序猿 • 2025年12月14日 04:56:14 • 用户投稿 • 阅读 0

本教程详细介绍了如何在Pandas DataFrame中将hh:mm:ss格式的时间字符串转换为总分钟数。文章首先分析了常见的转换错误，随后提供了两种解决方案：一种是基于字符串分割和Lambda表达式的直接修正方法，支持获取整数或浮点分钟数；另一种是利用Pandas内置的pd.to_timedelta函数进行更健壮、更符合Pandas惯例的转换，并推荐作为处理时间数据的最佳实践。

问题背景与挑战

在数据处理中，我们经常会遇到时间数据以字符串形式（如hh:mm:ss）存储的情况。当需要对这些时间进行数值计算，例如将其转换为总分钟数以便进行聚合或分析时，就需要进行格式转换。例如，将1:33:04（1小时33分钟4秒）转换为分钟，期望得到93.06分钟或93分钟。直接对字符串进行数学运算会导致错误，因此需要一套有效的方法来解析并计算。

假设我们有以下Pandas DataFrame：

import pandas as pddf = pd.DataFrame({'Name': ["Jim", "Chrissy", "Billy"], 'Time': ['1:33:04', '0:06:39', '10:00:02']})print("原始DataFrame:")print(df)

输出：

原始DataFrame:      Name      Time0      Jim   1:33:041  Chrissy   0:06:392    Billy  10:00:02

我们的目标是创建一个名为_timemin的新列，其中包含Time列对应的总分钟数。

常见错误分析

在尝试将hh:mm:ss格式的字符串转换为分钟时，初学者可能会遇到一些问题。例如，以下尝试代码：

# 错误的尝试# df['_timemin'] = df['Time'].str.split(':').apply(lambda x: (int(x[0])*60) + int(x[1])) + int(x[2]/60)

这段代码会产生NameError: name ‘x’ is not defined或其他类似错误。其主要问题在于：

apply方法的作用域不正确： apply方法应该作用于整个lambda表达式，而不是部分。在上述代码中，apply(lambda x: (int(x[0])*60) + int(x[1])) 试图在 apply 内部完成计算，但紧接着的 + int(x[2]/60) 却在 apply 外部，导致 x 变量在外部未定义。字符串元素未完全转换： 在进行数学运算前，所有从字符串中分割出来的元素（x[0], x[1], x[2]）都必须显式地转换为数值类型（例如int）。错误的代码中，x[2]在int(x[2]/60)中被当作字符串进行了除法运算，然后才尝试转换为整数，这是不符合逻辑的。

解决方案一：基于字符串分割与Lambda表达式

这种方法直接修正了上述错误，通过str.split(‘:’)将时间字符串分割成小时、分钟、秒的列表，然后使用apply和lambda表达式对每个列表进行计算。

import pandas as pddf = pd.DataFrame({'Name': ["Jim", "Chrissy", "Billy"], 'Time': ['1:33:04', '0:06:39', '10:00:02']})# 1. 获取整数总分钟数 (向下取整)# 将小时、分钟、秒都转换为整数，秒通过整数除法（//）转换为分钟df['_timemin_int'] = df['Time'].str.split(':').apply(lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) // 60)print("n方法一：整数总分钟数")print(df)# 2. 获取浮点数总分钟数 (保留秒的精度)# 将小时、分钟、秒都转换为整数，秒通过浮点除法（/）转换为分钟df['_timemin_float'] = df['Time'].str.split(':').apply(lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) / 60)print("n方法一：浮点数总分钟数")print(df)

代码解释：

df[‘Time’].str.split(‘:’): 这会将Time列中的每个字符串按:分割，生成一个包含小时、分钟、秒字符串的列表（例如[‘1′, ’33’, ’04’]）。.apply(lambda x: …): 对split操作产生的每个列表x应用一个匿名函数。int(x[0]) * 60: 将小时字符串x[0]转换为整数并乘以60，得到小时对应的分钟数。int(x[1]): 将分钟字符串x[1]转换为整数。int(x[2]) // 60 (整数分钟)：将秒字符串x[2]转换为整数，然后使用整数除法//将其转换为分钟数（向下取整）。int(x[2]) / 60 (浮点分钟)：将秒字符串x[2]转换为整数，然后使用浮点除法/将其转换为分钟数，保留小数部分。

解决方案二：利用Pandas内置时间序列功能（推荐）

对于更复杂或大规模的时间数据处理，Pandas提供了强大的Timedelta对象。将时间字符串转换为Timedelta对象，然后提取总秒数并转换为分钟，是更健壮、更符合Pandas惯例且通常性能更优的方法。

import pandas as pddf = pd.DataFrame({'Name': ["Jim", "Chrissy", "Billy"], 'Time': ['1:33:04', '0:06:39', '10:00:02']})# 1. 将时间字符串转换为Timedelta对象df['Time_timedelta'] = pd.to_timedelta(df['Time'])# 2. 从Timedelta对象中提取总秒数，并转换为总分钟数df['_timemin_td'] = df['Time_timedelta'].dt.total_seconds() / 60print("n方法二：利用Timedelta对象转换")print(df)

代码解释：

pd.to_timedelta(df[‘Time’]): 这是核心步骤。Pandas会自动解析hh:mm:ss格式的字符串，并将其转换为Timedelta类型。Timedelta对象表示一个时间差，它支持各种时间单位的计算。.dt.total_seconds(): 这是Timedelta序列的一个访问器，用于获取每个时间差的总秒数（以浮点数表示）。/ 60: 将总秒数除以60，即可得到总分钟数。

这种方法不仅代码更简洁，而且由于利用了Pandas底层的优化，对于大型数据集通常具有更好的性能。

完整示例与对比

为了清晰地展示所有方法的输出，我们将其整合到一个完整的示例中：

import pandas as pddf = pd.DataFrame({'Name': ["Jim", "Chrissy", "Billy"], 'Time': ['1:33:04', '0:06:39', '10:00:02']})# 方法一：基于字符串分割与Lambda表达式# 1.1 获取整数总分钟数 (向下取整)df['_timemin_int'] = df['Time'].str.split(':').apply(lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) // 60)# 1.2 获取浮点数总分钟数 (保留秒的精度)df['_timemin_float'] = df['Time'].str.split(':').apply(lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) / 60)# 方法二：利用Pandas内置时间序列功能（推荐）df['Time_timedelta'] = pd.to_timedelta(df['Time'])df['_timemin_td'] = df['Time_timedelta'].dt.total_seconds() / 60print("最终结果对比:")print(df)

输出结果：

最终结果对比:      Name      Time Time_timedelta  _timemin_int  _timemin_float  _timemin_td0      Jim   1:33:04        01:33:04            93       93.066667    93.0666671  Chrissy   0:06:39        00:06:39             6        6.650000     6.6500002    Billy  10:00:02        10:00:02           600      600.033333   600.033333

从结果可以看出，_timemin_float和_timemin_td列的结果是完全一致的，都精确到了秒的小数部分。_timemin_int列则进行了向下取整。

注意事项与总结

数据类型转换： 在进行任何数学运算之前，务必确保将从字符串中提取的数值转换为正确的数值类型（int或float）。这是避免TypeError的关键。选择合适的精度： 根据你的分析需求，决定是需要整数分钟数（使用//进行整数除法）还是浮点数分钟数（使用/进行浮点除法）。推荐使用pd.to_timedelta： 尽管基于字符串分割的方法可以直接解决问题，但pd.to_timedelta是处理时间数据的更专业、更高效且更健壮的方法。它能够处理更广泛的时间格式，并且是Pandas时间序列功能的基础，能更好地与后续的时间序列分析操作集成。错误处理： 对于生产环境中的数据，如果Time列可能包含非标准或无效的字符串，pd.to_timedelta提供了errors参数（如errors=’coerce’可以将无法解析的值转换为NaT，即Not a Time），这有助于更好地处理异常数据。

通过本教程，你现在应该能够根据具体需求，灵活且高效地在Pandas DataFrame中将hh:mm:ss格式的时间字符串转换为总分钟数。

以上就是Pandas中将hh:mm:ss时间格式转换为总分钟数的教程的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1365990.html

作用域

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

优化NumPy布尔数组到浮点数的快速映射

上一篇 2025年12月14日 04:56:09

怎样用Python绘制专业的数据分布直方图？

下一篇 2025年12月14日 04:56:24

好文分享

您不需要 CSS 预处理器

原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中，我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因，并向您展示如何使用原生 css 完成这些相同的事情。分隔文件分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

程序猿
2025年12月24日
1000
好文分享

React 嵌套组件中，CSS 样式会互相影响吗？

react 嵌套组件 css 穿透影响在 react 中，嵌套组件的 css 样式是否会相互影响，取决于采用的 css 解决方案。传统 css 如果使用传统的 css，在嵌套组件中定义的样式可能会穿透影响到父组件。例如，在给出的代码中：立即学习“前端免费学习笔记（深入）”； component…

程序猿
2025年12月24日
0000
好文分享

React 嵌套组件中父组件 CSS 修饰会影响子组件样式吗？

对嵌套组件的 CSS 修饰是否影响子组件样式提问：在 React 中，如果对嵌套组件 ComponentA 配置 CSS 修饰，是否会影响到其子组件 ComponentB 的样式？ComponentA 是由 HTML 元素（如 div）组成的。回答：立即学习“前端免费学习笔记（深入）”；在…

程序猿
2025年12月24日
0000
好文分享

在 React 项目中实现 CSS 模块

react 中的 css 模块是一种通过自动生成唯一的类名来确定 css 范围的方法。这可以防止大型应用程序中的类名冲突并允许模块化样式。以下是在 react 项目中使用 css 模块的方法： 1. 设置默认情况下，react 支持 css 模块。你只需要用扩展名 .module.css 命名你的…

程序猿
2025年12月24日
0000
好文分享

action在css中的用法

CSS 中 action 关键字用于定义鼠标悬停或激活元素时的行为，语法：element:action { style-property: value; }。它可以应用于 :hover 和 :active 伪类，用于创建交互效果，如更改元素外观、显示隐藏元素或启动动画。 action 在 CSS 中…

程序猿
2025年12月24日
0000
好文分享

css规则的类型有哪些

CSS 规则包括：通用规则：选择所有元素类型选择器：根据元素类型选择元素类选择器：根据元素的 class 属性选择元素ID 选择器：根据元素的 id 属性选择元素（唯一）后代选择器：选择特定父元素内的元素子选择器：选择作为特定父元素的直接子元素的元素伪类：基于元素的状态或特性选择元素伪元素：创建元素…

程序猿
2025年12月24日
1000
html5怎么引用js_HTML5用外链或内嵌JS代码引用脚本【引用】

HTML5中执行JavaScript需通过外链或内嵌方式引入：一、外链用，支持defer/async；二、内嵌将代码写入间，推荐置于body底部；三、type属性默认可省略；四、模块化使用type=”module”支持ES6 import/export。 <img sr…

程序猿
好文分享 2025年12月23日
1000
好文分享

html5框架怎么设置_HTML5用iframe或div框架集嵌入子页面设框架【设置】

HTML5中嵌入子页面的现代方案有四种：一、用iframe标签直接嵌入，支持安全与可访问性属性；二、用CSS Grid/Flexbox布局配合JavaScript动态加载HTML片段；三、用Shadow DOM封装自定义元素实现样式脚本隔离；四、用object标签嵌入HTML并提供fallback内…

程序猿
2025年12月23日
2000
好文分享

带文字描边的HTML5按钮样式写法【方法】

可通过text-shadow、-webkit-text-stroke、SVG文本或CSS自定义属性实现HTML5按钮文字描边：text-shadow兼容性好但需多向阴影；-webkit-text-stroke简洁可控但仅限WebKit浏览器；SVG提供高精度描边；CSS变量支持动态主题切换。如果您…

程序猿
2025年12月23日
0000
好文分享

html5怎样设计瀑布流布局_html5瀑布流实现与图片懒加载【教程】

HTML5可通过CSS Grid、Masonry.js、多列布局、IntersectionObserver懒加载及容器查询五种方式实现瀑布流布局。CSS Grid无需JS、响应式强；Masonry.js定位精准适合动态内容；多列布局代码简洁；IntersectionObserver实现高性能懒加载；…

程序猿
2025年12月23日
0000
好文分享

京东html5如何布局_解析京东H5页面布局结构与技巧【布局】

京东H5页面采用模块化、响应式与语义化结合的设计逻辑：一、用Flexbox实现弹性布局；二、依BEM规范组织HTML结构；三、以viewport与rem实现响应式适配；四、用CSS Grid管理复杂网格；五、借data属性驱动动态样式。如果您正在分析京东HTML5页面的布局结构，会发现其采用模块化…

程序猿
2025年12月23日
4000
好文分享

jimdo如何添加html5通知提醒_jimdo通知提醒html5代码与弹出位置【步骤】

Jimdo网站实现HTML5通知需分四步：一、在页脚代码调用Notification.requestPermission()申请权限；二、权限获准后用new Notification()触发通知，可加setTimeout延迟；三、添加按钮手动触发并处理权限状态；四、因API不支持定位，可用浮动DOM…

程序猿
2025年12月23日
0000
好文分享

html5怎么设计代码_html5按结构语义分层写标签CSS JS保持代码整洁【设计】

应按语义化层级组织HTML5结构：一、用header/nav/main/article/section/aside/footer替代div；二、HTML/CSS/JS物理分离；三、class名遵循BEM规范且语义化；四、用data-*属性解耦交互；五、CSS变量与JS同步状态。如果您正在编写 HT…

程序猿
2025年12月23日
0000
好文分享

如何改变颜色HTML里_修改HTML元素颜色属性方法【修改】

可通过五种方式修改HTML元素颜色：一、内联样式直接设color属性；二、内部样式表在head中用style标签定义；三、外部CSS文件通过link引入；四、JavaScript动态修改style.color；五、CSS变量统一管理主题色。如果您希望在HTML中更改某个元素的显示颜色，可以通过多种…

程序猿
2025年12月23日
0000
好文分享

html如何创建表格_使用HTML标签快速创建数据表格【数据】

HTML表格使用构建，支持scope属性提升可访问性、colspan/rowspan合并单元格、添加标题及内联样式控制外观。如果您需要在网页中展示结构化数据，HTML 提供了原生的表格标签来快速构建清晰、语义化的数据表格。以下是使用 HTML 标签创建表格的具体方法：一、使用、、和构建基础…

程序猿
2025年12月23日
3000
好文分享

怎么构建html5框架_HTML5用div或框架集分模块搭页面基础框架【构建】

应采用语义化HTML5结构元素（如header、nav、main、aside、footer）构建网页基础框架，替代已废弃的frameset标签，兼顾可访问性、SEO与现代布局需求。如果您需要为网页搭建一个结构清晰、语义明确的HTML5基础框架，则需避免使用已废弃的框架集（frameset）标签，转…

程序猿
2025年12月23日
0000
好文分享

HTML如何嵌套多层标签_结构层次设计解析【方案】

HTML多层标签嵌套需遵循语义化规则、CSS作用域隔离、中立容器分组、规避隐式闭合及模板逻辑抽象五大方法，确保结构合法、可维护且无障碍。 HTML文档中嵌套多层标签是构建语义化、可维护页面结构的基础操作。若标签嵌套混乱或违反层级规范，可能导致渲染异常、无障碍访问失效或CSS选择器失效。以下是符合标准…

程序猿
2025年12月23日
0000
好文分享

HTML如何防范渗透攻击_前端安全加固策略【教程】

HTML前端安全加固需实施五项措施：一、配置CSP策略并禁用内联脚本；二、按上下文对用户输入进行精准编码；三、禁用document.write等危险API并限制iframe沙箱权限；四、通过meta标签模拟关键安全响应头；五、构建时清除注释、日志及敏感信息。如果您的HTML页面存在未过滤的用户输入…

程序猿
2025年12月23日
0000
好文分享

animate制作html5动画_时间轴与交互动画设计【指南】

Animate HTML5 Canvas动画异常的解决方法包括：一、修正帧标签与关键帧；二、正确绑定按钮事件监听器；三、用CreateJS Tween替代传统补间；四、调试元素引用与作用域；五、禁用自动播放并手动控制。如果您使用Adobe Animate制作HTML5 Canvas动画，但发现时间…

程序猿
2025年12月23日
0000
好文分享

html5如何使用id_正确使用HTML5元素的id属性技巧【技巧】

HTML5中正确使用id属性需遵循五项技巧：一、id须以字母开头且不含空格或特殊符号；二、杜绝重复并优先用语义化元素替代；三、避免与保留字或CSS伪类冲突；四、在ARIA中确保id真实唯一以支持可访问性；五、用开发者工具验证id有效性与唯一性。如果您在HTML5中为元素设置id属性，但发现CSS样…

程序猿
2025年12月23日
0000