Pandas中将hh:mm:ss时间字符串转换为总分钟数教程

程序猿 • 2025年12月14日 04:58:10 • 用户投稿 • 阅读 0

本教程详细介绍了如何在Pandas DataFrame中将hh:mm:ss格式的时间字符串高效转换为总分钟数。文章将从数据准备开始，逐步讲解使用str.split结合apply方法进行转换的两种方案，包括获取整数分钟和浮点分钟，并深入分析常见错误及其修正方法，旨在帮助用户准确处理时间数据类型转换。

1. 数据准备与需求分析

在数据分析和处理中，我们经常会遇到需要将特定格式的时间字符串转换为数值型时间单位的需求。本教程的目标是将Pandas DataFrame中hh:mm:ss（时:分:秒）格式的时间列转换为以分钟为单位的总时长，可以保留小数（浮点分钟）或向下取整（整数分钟）。

首先，我们创建一个示例DataFrame：

import pandas as pd# 创建示例DataFramedf = pd.DataFrame({    'Name': ["Jim", "Chrissy", "Billy"],    'Time': ['1:33:04', '0:06:39', '10:00:02']})print("原始DataFrame:")print(df)

输出的DataFrame如下所示：

原始DataFrame:      Name      Time0      Jim   1:33:041  Chrissy   0:06:392    Billy  10:00:02

我们的目标是添加一个新列，例如_timemin，将Time列中的每个时间值转换为对应的总分钟数。例如，10:00:02应转换为600.03分钟。

2. 常见错误解析

在尝试进行此类转换时，初学者可能会遇到一些问题。以下是一个常见的错误尝试及其原因分析：

# 错误的尝试# df['_timemin'] = df['Time'].str.split(':').apply(lambda x: (int(x[0])*60) + int(x[1])) + int(x[2]/60)# 上述代码会产生 NameError: name 'x' is not defined

这个错误尝试存在以下几个关键问题：

apply方法闭合问题： 表达式 df[‘Time’].str.split(‘:’).apply(lambda x: (int(x[0])*60) + int(x[1])) 的 apply 方法在 int(x[1]) 之后就已结束。这意味着 + int(x[2]/60) 这部分代码是在 apply 方法外部执行的。lambda x作用域： 由于 + int(x[2]/60) 在 apply 外部，x 这个变量（代表当前行的时间列表）在 apply 外部是未定义的，从而导致 NameError: name ‘x’ is not defined。数据类型转换： 即使 x[2] 能被访问到，它也是一个字符串（例如 “04” 或 “02”），在进行除法运算前必须先将其转换为数值类型（例如 int(x[2])）。

理解这些错误有助于我们构建正确的解决方案。

3. 解决方案详解

我们将提供两种基于str.split和apply方法的解决方案，分别用于获取整数分钟数和浮点分钟数。

3.1 获取整数分钟数（向下取整）

如果我们需要将秒数转换为分钟时进行向下取整（即忽略不足一分钟的秒数），可以使用整数除法 //。

# 方案一：转换为整数分钟数（向下取整）df_int_minutes = df.copy() # 使用副本，避免修改原始dfdf_int_minutes['_timemin_int'] = df_int_minutes['Time'].str.split(':').apply(    lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) // 60)print("n转换为整数分钟数:")print(df_int_minutes)

代码解释：

df_int_minutes[‘Time’].str.split(‘:’)：将Time列的每个字符串按 : 分割，返回一个Series，其中每个元素是一个包含小时、分钟、秒字符串的列表（例如 [‘1′, ’33’, ’04’]）。.apply(lambda x: …)：对Series中的每个列表 x 执行lambda函数。int(x[0]) * 60：将小时字符串（x[0]）转换为整数并乘以60，得到小时对应的分钟数。int(x[1])：将分钟字符串（x[1]）转换为整数。int(x[2]) // 60：将秒字符串（x[2]）转换为整数，然后使用整数除法 // 将秒转换为分钟，结果向下取整。三部分相加，得到总的整数分钟数。

输出结果：

转换为整数分钟数:      Name      Time  _timemin_int0      Jim   1:33:04            931  Chrissy   0:06:39             62    Billy  10:00:02           600

3.2 获取浮点分钟数（精确到小数）

如果需要精确到小数的分钟数，则应使用浮点除法 / 将秒转换为分钟。

# 方案二：转换为浮点分钟数df_float_minutes = df.copy() # 使用副本df_float_minutes['_timemin_float'] = df_float_minutes['Time'].str.split(':').apply(    lambda x: int(x[0]) * 60 + int(x[1]) + int(x[2]) / 60)print("n转换为浮点分钟数:")print(df_float_minutes)

代码解释：此方案与整数分钟数的代码类似，唯一区别在于将秒转换为分钟时使用了浮点除法 / (int(x[2]) / 60)，以保留小数部分。

输出结果：

转换为浮点分钟数:      Name      Time  _timemin_float0      Jim   1:33:04       93.0666671  Chrissy   0:06:39        6.6500002    Billy  10:00:02      600.033333

4. 进阶方法与注意事项

4.1 使用 pd.to_timedelta 的更优雅方式

虽然上述str.split结合apply的方法能够解决问题，但Pandas提供了更强大和语义化的时间处理工具。对于hh:mm:ss这种标准时间格式，推荐使用pd.to_timedelta将其转换为时间差（Timedelta）对象，然后利用Timedelta对象的属性来获取总秒数或总分钟数。这种方法通常更健壮，且能处理更多复杂的时间格式。

# 进阶方法：使用 pd.to_timedeltadf_timedelta = df.copy()df_timedelta['timedelta'] = pd.to_timedelta(df_timedelta['Time'])df_timedelta['_timemin_pd_elegant'] = df_timedelta['timedelta'].dt.total_seconds() / 60print("n使用pd.to_timedelta转换:")print(df_timedelta)

代码解释：

pd.to_timedelta(df_timedelta[‘Time’])：将Time列的字符串转换为Pandas Timedelta对象。Pandas能够智能识别hh:mm:ss格式。.dt.total_seconds()：这是Timedelta Series的一个访问器，用于获取每个Timedelta对象的总秒数（浮点数）。/ 60：将总秒数除以60，得到总分钟数。

输出结果：

使用pd.to_timedelta转换:      Name      Time timedelta  _timemin_pd_elegant0      Jim   1:33:04  0 days 01:33:04            93.0666671  Chrissy   0:06:39  0 days 00:06:39             6.6500002    Billy  10:00:02 0 days 10:00:02           600.033333

可以看出，_timemin_pd_elegant列的结果与_timemin_float列完全一致，但代码更简洁、可读性更强。

4.2 注意事项总结

数据类型转换： 在进行任何数学运算之前，务必确保从字符串中提取的组件（如小时、分钟、秒）已正确转换为数值类型（int或float）。Lambda函数作用域： 使用apply(lambda x: …)时，确保所有对x元素的引用和计算逻辑都包含在lambda函数的括号内部，避免因作用域问题导致NameError。除法运算符选择： 根据业务需求选择正确的除法运算符：//：整数除法，结果向下取整。适用于需要整数分钟数的场景。/：浮点除法，结果保留小数。适用于需要精确分钟数的场景。Pandas惯用方法： 对于时间数据处理，优先考虑使用Pandas内置的pd.to_timedelta、pd.to_datetime等函数，它们通常更高效、更健壮，且能处理更多边缘情况。

总结

本教程详细阐述了在Pandas中将hh:mm:ss格式时间字符串转换为总分钟数的多种方法。我们首先分析了使用str.split和apply时常见的错误，并提供了两种基于此方法的正确实现，分别用于获取整数分钟和浮点分钟。最后，我们介绍了使用pd.to_timedelta这一更符合Pandas风格的优雅解决方案。掌握这些方法将有助于您高效、准确地处理DataFrame中的时间数据，避免常见的类型转换和作用域错误。在实际项目中，推荐优先使用pd.to_timedelta以获得更好的代码可读性和鲁棒性。

以上就是Pandas中将hh:mm:ss时间字符串转换为总分钟数教程的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1366072.html

代码可读性作用域区别工具

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

优化NumPy布尔数组到浮点数的极速映射

上一篇 2025年12月14日 04:58:09

Python怎样计算数据分布的偏度和峰度？

下一篇 2025年12月14日 04:58:14

好文分享

为什么自定义样式表在 Safari 中访问百度页面时无法生效？

自定义样式表在 safari 中失效的原因用户尝试在 safari 偏好设置中添加自定义样式表，代码如下： body { background-image: url(“/users/luxury/desktop/wallhaven-o5762l.png”) !important;} 测试后发现，在…

程序猿
2025年12月24日
1000
如何在网页 F12 调试中查看鼠标悬停时才出现的 DOM 元素？

如何在网页 f12 调试中查看鼠标悬停时才出现的 dom 元素？在 f12 调试模式下，鼠标悬停时才出现的 dom 元素无法通过直接选择查看。解决方法根据显示原理的不同而有所区别： 1. css 控制的元素强制开启悬停状态：在 firefox 浏览器中，可以通过在开发者工具中手动开启选中元素的 …

程序猿
2025年12月24日 • 好文分享
2000
好文分享

TDesign UI库中小程序开发的CSS选择器：为什么“.t-grid–card”能生效？

TDesign UI库中CSS选择器困惑在小程序开发中，使用TDesign UI库时，您可能会遇到一个困惑的CSS选择器。例如，在DOM结构中，一个元素的class为”t-grid t-card class t-class”, 但其CSS选择器却是”&#8216…

程序猿
2025年12月24日
1000
好文分享

逻辑属性与旧版属性：如何根据文本方向选择合适的CSS属性？

CSS 逻辑属性与旧版属性 CSS 中引入了逻辑属性和旧版属性的概念。这些属性负责控制页面元素的外观和布局。逻辑属性逻辑属性以逻辑方向命名，如左右、上下。它们根据元素在文档流中的位置来确定元素的外观。例如：立即学习“前端免费学习笔记（深入）”； marginBlockStart：控制元素在垂直…

程序猿
2025年12月24日
1000
好文分享

CSS 逻辑属性和旧版属性：如何选择？

css逻辑属性与旧版属性 css中，逻辑属性和旧版属性用于控制元素的布局和外观。然而，两者在语法和使用方式上有所不同。逻辑属性逻辑属性是基于元素在现实世界中的预期行为来命名的。它使用诸如 “start”、”end” 和 “block&#…

程序猿
2025年12月24日
2000
好文分享

您不需要 CSS 预处理器

原生 css 在最近几个月/几年里取得了长足的进步。在这篇文章中，我将回顾人们使用 sass、less 和 stylus 等 css 预处理器的主要原因，并向您展示如何使用原生 css 完成这些相同的事情。分隔文件分离文件是人们使用预处理器的主要原因之一。尽管您已经能够将另一个文件导入到 css…

程序猿
2025年12月24日
1000
好文分享

动态样式类名为何失效：嵌套与并列选择器的区别在哪里？

动态样式类名不起作用：嵌套与并列问题在使用动态样式类名时，有时会遇到尽管触发事件但样式却没有改变的情况。这可能是由于使用了后代选择器而造成的。以提供的代码为例：块中，嵌套的类是content类的后代。这意味着类仅在元素包含子元素时才能生效。为了解决这个问题，需要将与类编写为并列，而不是嵌套方…

程序猿
2025年12月24日
3000
好文分享

CSS 定位属性：六种定位方式的区别是什么？

CSS中的定位属性及其区别 CSS中的 position 属性定义元素的定位行为，它共有六个可供选择的属性值，分别是：静态定位 (static)：默认值，元素按照正常文档流进行定位。相对定位 (relative)：元素相对于自身原本的位置进行偏移。绝对定位 (absolute)：元素相对于最近的非…

程序猿
2025年12月24日
1000
好文分享

React 嵌套组件中，CSS 样式会互相影响吗？

react 嵌套组件 css 穿透影响在 react 中，嵌套组件的 css 样式是否会相互影响，取决于采用的 css 解决方案。传统 css 如果使用传统的 css，在嵌套组件中定义的样式可能会穿透影响到父组件。例如，在给出的代码中：立即学习“前端免费学习笔记（深入）”； component…

程序猿
2025年12月24日
0000
好文分享

React 嵌套组件中父组件 CSS 修饰会影响子组件样式吗？

对嵌套组件的 CSS 修饰是否影响子组件样式提问：在 React 中，如果对嵌套组件 ComponentA 配置 CSS 修饰，是否会影响到其子组件 ComponentB 的样式？ComponentA 是由 HTML 元素（如 div）组成的。回答：立即学习“前端免费学习笔记（深入）”；在…

程序猿
2025年12月24日
0000
好文分享

父元素仅设置 Line-height 对子元素高度的影响：行内块级元素与块级元素有什么区别？

父元素仅设置 Line-height 对子元素的块级或行内块级元素的影响当父元素只设置了 Line-height 而没有设置高度时，对其子元素的影响将取决于子元素的类型。如果子元素是行内块级元素，如 inine-block，父元素的 Line-height 将成为子元素的高度。这是因为行内块级元…

程序猿
2025年12月24日
1000
好文分享

当父元素仅设置行高时，块级和行内块级元素的行为有何区别？

当父元素仅设置行高时，块级或行内块级子元素的行为在 html 中，当父元素仅设置行高 line-height 时，块级或行内块级元素的行为会有所不同。 <line-height: 60px; background-color: antiquewhite; 哈哈哈行内块级元素（display…

程序猿
2025年12月24日
3000
好文分享

为什么将perspective样式设置在带有transform-style: preserve-3d样式的元素的父级元素上才能得到预期的3D变换效果？

perspective必须设置在带有transform style: preserve-3d样式的元素的父级元素上吗？问题：你的HTML和CSS代码中，将perspective样式设置在了.scene元素上，当你将其移动到.cube元素后，效果却发生了变化。这是为什么？解答： perspect…

程序猿
2025年12月24日
1000
好文分享

perspective属性设置在父元素和后代元素上，对3D效果有什么区别？

perspective属性的位置对3d效果的影响通常情况下，perspective属性需要设置在应用了transform-style: preserve-3d属性的父元素上。然而，如果perspective属性设置在后代元素上会产生不同的效果。为了演示区别，让我们扩展已有的示例： front b…

程序猿
2025年12月24日
0000
好文分享

CSS perspective 属性，设置在不同元素上会产生什么区别？

perspective 属性在不同元素上的效果对比 CSS 中的 perspective 属性用于指定 3D 转换的视角距离。它可以通过改变物体相对于观察者的远近距离来创建三维效果。然而，将 perspective 设置在不同的元素上会产生不同的效果。根据提供的代码，我们将 perspective…

程序猿
2025年12月24日
0000
好文分享

什么是功能类优先的 CSS 框架？

理解功能类优先 tailwind css 是一款功能类优先的 css 框架，用户可以通过组合功能类轻松构建设计。为了理解功能类优先，我们首先要区分语义类和功能类这两种 css 类名命名方式。语义类以前比较常见的 css 命名方式是根据页面中模块的功能来命名。例如：立即学习“前端免费学习笔记（深…

程序猿
2025年12月24日
1000
好文分享

## PostCSS vs. Sass/Less/Stylus：如何选择合适的 CSS 代码编译工具？

PostCSS 与 Sass/Less/Stylus：CSS 代码编译转换中的异同在 CSS 代码的编译转换领域，PostCSS 与 Sass/Less/Stylus 扮演着重要的角色，但它们的作用却存在细微差异。区别 PostCSS 主要是一种 CSS 后处理器，它在 CSS 代码编译后进行处…

程序猿
2025年12月24日
0000
好文分享

CSS flex 布局中 justify-content 的 flex-start 和 start 的区别是什么？

CSS flex 中 justify-content 的 flex-start 和 start 的区别在 CSS flex 布局中，justify-content 属性用于控制子元素在主轴上的对齐方式。其中，flex-start 和 start 似乎是相同的，但实际上它们有微妙的区别。定义根据…

程序猿
2025年12月24日
0000
好文分享

css flex 中 justify-content 的 flex-start 和 start 可互换吗？

CSS flex 中 justify-content 的 flex-start 和 start 区别解析 MDN 文档上似乎没有提及 start 和 flex-start 在 justify-content 中的区别，但 post-css 插件却会对此发出警告。本文将对此进行解析。虽然在官方规范中…

程序猿
2025年12月24日
0000
好文分享

“flex-start”和“start”在 CSS Flex 中有何差异？

深入剖析 CSS Flex 中 justify-content 的 start 和 flex-start 在 CSS 的 flex 布局中，justify-content 属性控制子元素在主轴上的对齐方式，其中包含两个值：”flex-start” 和 “start…

程序猿
2025年12月24日
0000