Pandas DataFrame行求和：解决混合数据类型导致0值结果的问题

程序猿 • 2025年12月14日 23:01:53 • 用户投稿 • 阅读 0

本教程旨在解决pandas dataframe在对包含混合数据类型的行进行求和时，numeric_only=true参数失效并返回0值的问题。核心解决方案是利用pd.to_numeric函数的errors=’coerce’参数，将非数值型数据安全转换为nan，然后再进行行求和，从而确保准确计算。文章还将演示如何将总秒数转换为可读的时间格式。

在数据分析实践中，我们经常需要对Pandas DataFrame的行进行数值求和。然而，当DataFrame中包含混合数据类型（例如，数字以字符串形式存储，或存在非数字文本、列表等）时，直接使用df.sum(axis=1, numeric_only=True)可能无法得到预期的结果，甚至会返回一列0.0。本教程将深入探讨这个问题的原因，并提供一个健壮的解决方案。

理解 numeric_only=True 的局限性

pandas.DataFrame.sum() 方法提供了一个 numeric_only=True 参数，旨在只对DataFrame中的数值列进行求和。然而，其工作机制可能与直觉有所不同。当一个列被指定为 numeric_only=True 时，Pandas会检查该列的整体数据类型（dtype）。如果该列中包含任何非数值型数据（即使大部分是数字，但有一两个字符串或列表），Pandas会认为该整列是非数值列，并将其排除在求和计算之外。

例如，如果一个日期列中包含了像 ‘29160’ (字符串形式的数字) 和 ‘No hours logged’ (非数字字符串) 这样的混合值，Pandas会将整个列识别为 object 类型，并因 numeric_only=True 而将其跳过。如果所有需要求和的列都存在这种情况，那么最终的行求和结果将是对一个空集合求和，默认返回0.0。

解决方案：使用 pd.to_numeric 进行预处理

要正确地对包含混合数据类型的行进行求和，我们需要在求和之前，将所有潜在的数值型数据统一转换为真正的数值类型。pandas.to_numeric() 函数是完成此任务的理想工具，尤其是结合 errors=’coerce’ 参数。

pd.to_numeric(series, errors=’coerce’) 会尝试将Series中的每个元素转换为数值类型。如果转换成功，它将返回对应的数值；如果转换失败（例如，遇到 ‘No hours logged’ 或 [10:02, Odd number: missing entry] 这样的非数字字符串），errors=’coerce’ 参数将把这些无效值替换为 NaN (Not a Number)。NaN 值在进行求和时会被自动忽略，从而确保求和的准确性。

示例数据准备

首先，我们准备一个示例DataFrame，它模拟了实际数据中可能出现的混合数据类型情况。

import pandas as pdimport numpy as np # 用于可能的NaN操作data = {    'id': {0: 514, 1: 2414, 2: 3225, 3: 3434, 4: 3864, 5: 4716, 6: 5793},    'name': {0: 'alexis', 1: 'donald', 2: 'mackenzie', 3: 'louisa', 4: 'olga', 5: 'rick', 6: 'roberta'},    '2023-11-28': {0: 'No hours logged', 1: '29160', 2: '28500', 3: '25380', 4: '15600', 5: '30180', 6: '29220'},    '2023-11-29': {0: 'No hours logged', 1: '29160', 2: '28620', 3: '18840', 4: '19080', 5: '28800', 6: '29220'},    '2023-11-30': {0: 'No hours logged', 1: '28860', 2: '28560', 3: '26040', 4: '14400', 5: '28740', 6: '29460'},    '2023-12-01': {0: 'No hours logged', 1: '28620', 2: '28620', 3: 'No hours logged', 4: '13800', 5: '28620', 6: '29280'},    '2023-12-02': {0: 'No hours logged', 1: '[10:02, Odd number: missing entry]', 2: '28980', 3: '25560', 4: '5220', 5: '28680', 6: '29340'},    '2023-12-03': {0: 'No hours logged', 1: 'No hours logged', 2: 'No hours logged', 3: 'No hours logged', 4: '17820', 5: 'No hours logged', 6: 'No hours logged'},    '2023-12-04': {0: 'No hours logged', 1: 'No hours logged', 2: 'No hours logged', 3: 'No hours logged', 4: 'No hours logged', 5: 'No hours logged', 6: 'No hours logged'},    '2023-12-05': {0: 'No hours logged', 1: '28860', 2: '28740', 3: '24900', 4: '14400', 5: '28680', 6: '29040'},}df = pd.DataFrame(data)print("原始DataFrame:")print(df)

执行精确的行求和

接下来，我们将使用 pd.to_numeric 结合 apply 方法对选定的日期列进行预处理，然后进行行求和。

# 注意：'id'是索引为0的列，'name'是索引为1的列。# 我们需要从索引为2的列（即第一个日期列）开始选择。# 使用 .iloc[:, 2:] 选择从第三列到最后一列的所有数据。# 对选定列的每一列应用 pd.to_numeric，将非数字值转换为 NaN。# 最后，对转换后的DataFrame按行求和 (axis=1)。df['total_hours'] = (    df.iloc[:, 2:]      .apply(lambda x: pd.to_numeric(x, errors='coerce'))      .sum(axis=1))print("n添加'total_hours'列后的DataFrame（仅显示相关列）:")print(df[['id', 'name', 'total_hours']])

运行上述代码，您会看到 total_hours 列现在包含了每行实际的工时总和（以秒为单位），而不是0.0。例如，对于 donald 这一行，所有有效的秒数都被正确地加总。

格式化总工时为可读时间

原始问题提到希望将总秒数转换为 HH:MM 格式。Pandas的 pd.to_timedelta() 函数可以非常方便地完成这个任务，它将秒数转换为 timedelta 对象，可以直接表示为天、小时、分钟和秒。

# 将total_hours（秒）转换为timedelta对象df['total_hours_formatted'] = pd.to_timedelta(df['total_hours'], unit='s')print("n格式化后的总工时:")print(df[['id', 'name', 'total_hours', 'total_hours_formatted']])

通过 pd.to_timedelta(df[‘total_hours’], unit=’s’)，我们得到了一个更易读的时间格式，例如 1 days 16:11:00，这比原始的秒数更加直观。

注意事项与总结

数据类型检查: 在进行任何数值计算之前，始终建议检查相关列的数据类型 (df.dtypes)。这有助于识别潜在的混合数据类型问题。errors=’coerce’ 的重要性: 当处理可能含有非数值字符串的列时，errors=’coerce’ 是将数据清洗为可计算形式的关键。它能优雅地处理无效数据，避免程序崩溃。精确的列选择: 使用 iloc 或明确的列名列表来确保只对目标列进行操作，避免包含不需要的非数值列（如 id 或 name）。pd.to_timedelta 的应用: 对于时间相关的数值求和，这是一个非常有用的后续处理步骤，能显著提高数据可读性。性能考量: 对于非常大的DataFrame，apply 函数可能会比矢量化操作慢。但在大多数情况下，对于行级别的转换和求和，它的可读性和灵活性使其成为一个很好的选择。

通过上述方法，您可以有效地处理Pandas DataFrame中混合数据类型的行求和问题，确保计算的准确性，并将结果以更友好的格式呈现。

以上就是Pandas DataFrame行求和：解决混合数据类型导致0值结果的问题的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1381522.html

app mac 工具数据清洗

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

解决Polars动态API注册与Python类型检查器的兼容性问题

上一篇 2025年12月14日 23:01:48

异步协程中控制流与资源锁的精细化管理

下一篇 2025年12月14日 23:02:07

好文分享

响应式HTML5按钮适配不同屏幕方法【方法】

实现响应式HTML5按钮需五种方法：一、CSS媒体查询按max-width断点调整样式；二、用rem/vw等相对单位替代px；三、Flexbox控制容器与按钮伸缩；四、CSS变量配合requestAnimationFrame优化的JS动态适配；五、Tailwind等框架的响应式工具类。如果您希望H…

程序猿
2025年12月23日
1000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

在HTML5中执行JavaScript需通过script标签：一、内联编写于head或body中；二、外链引入.js文件并建议放body末尾或加defer；三、defer按序执行，async独立执行；四、可动态创建script元素插入执行。如果您希望在HTML5页面中执行JavaScript代码，…

程序猿
2025年12月23日
0000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
4000
好文分享

html5能否插入带表单的文档_html5表单文档嵌入与数据提交【步骤】

HTML5中无法直接嵌入外部带表单的HTML文档并原生提交；可行方案有四：一、用iframe嵌入，需同源或CORS支持，并用postMessage通信；二、用fetch+DOMParser动态加载表单片段并手动绑定事件；三、在当前页面直接编写表单，最规范且兼容性好；四、用JavaScript+fet…

程序猿
2025年12月23日
1000
好文分享

html5游戏怎么修改_HT5改JS逻辑或资源文件调整游戏玩法效果【修改】

需直接编辑核心JavaScript代码或替换图片、音频等资源文件；先用浏览器开发者工具的Sources面板定位含game、main等关键词的.js文件，再搜索score++、if (health等逻辑片段进行修改。如果您下载了某个HTML5游戏的本地文件，希望调整其玩法逻辑或替换资源以改变视觉效果…

程序猿
2025年12月23日
1000
好文分享

360怎么装html5_360浏览器默认支持HTML5无需额外安装设置【说明】

HTML5是网页标准，非独立软件，360浏览器7.0+已原生支持；需确认内核为Blink/Chromium、关闭兼容模式、禁用强制兼容策略、重置Flash插件、清除HTML5本地存储、检查系统Media Foundation组件。如果您在使用360浏览器时发现HTML5网页功能异常（如视频无法播放…

程序猿
2025年12月23日
4000
好文分享

html5怎么重叠图片_html5用position:absolute或z-index让图片重叠【重叠】

在HTML5中实现图片重叠需结合CSS定位与层叠控制：一、用position:absolute+top/left精确定位，父容器设position:relative；二、用z-index设定堆叠顺序（需已定位）；三、用transform:translate()实现无文档流干扰的偏移重叠；四、用CSS…

程序猿
2025年12月23日
3000
好文分享

html如何滑动_实现HTML页面或元素滑动效果【效果】

可通过CSS scroll-behavior实现平滑锚点跳转，JavaScript scrollTo精确控制滚动位置，CSS transform模拟高性能滑动动画，或使用Swiper等第三方库实现触摸拖拽、循环播放等高级交互功能。如果您希望在网页中实现页面或特定元素的滑动效果，可以通过CSS和Ja…

程序猿
2025年12月23日
0000
好文分享

html5如何建立站点_HTML5站点建立步骤与网站搭建技巧【指南】

HTML5网站搭建需五步：一、建my-website目录及css/js/images子目录，含index.html；二、写标准HTML5骨架，含DOCTYPE、lang、meta、语义化标签；三、外链CSS与defer/async脚本；四、用http-server启本地服务；五、用email/num…

程序猿
2025年12月23日
0000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
3000
好文分享

html5能否让搜索框随滚动固定_html5positionfixed固定布局【攻略】

可使用CSS的position: fixed实现搜索框固定定位，或用position: sticky实现边界感知粘性效果，配合JavaScript动态控制、响应式适配及占位修复，确保滚动时稳定显示。如果您希望在网页滚动过程中让搜索框始终保持在可视区域的固定位置，HTML5 本身不提供直接的布局控制…

程序猿
2025年12月23日
3000
好文分享

html5怎么设置黑体_html5用CSS font-family设黑体或font-weight加粗【设置】

在HTML5中实现黑体及加粗需用CSS的font-family和font-weight：一、font-family按优先级列“SimHei”,“Microsoft YaHei”,“Heiti SC”,sans-serif；二、font-weight用700或bold；三、组合声明并注意继承；四、可用…

程序猿
2025年12月23日
1000
好文分享

html5怎么去除黑点_html5用list-style:none去除ul/ol列表黑点【去除】

可通过 CSS 的 list-style 属性隐藏列表标记：一、list-style: none 最常用；二、list-style-type: none 精准移除符号；三、重置 list-style 全部子属性应对样式干扰；四、display: inline-block 配合 list-style:…

程序猿
2025年12月23日
1000
好文分享

如何操作html_操作HTML元素的常用方法【常用】

必须掌握操作HTML元素的五种核心方法：一、通过ID精准获取并修改单个元素；二、通过类名批量操作多个元素；三、用querySelector系列灵活选择任意CSS匹配元素；四、动态创建并插入新元素；五、安全移除或替换现有元素。如果您需要动态修改网页内容或响应用户交互，则必须掌握操作HTML元素的核心…

程序猿
2025年12月23日
9000
好文分享

html5框架怎么设置_HTML5用iframe或div框架集嵌入子页面设框架【设置】

HTML5中嵌入子页面的现代方案有四种：一、用iframe标签直接嵌入，支持安全与可访问性属性；二、用CSS Grid/Flexbox布局配合JavaScript动态加载HTML片段；三、用Shadow DOM封装自定义元素实现样式脚本隔离；四、用object标签嵌入HTML并提供fallback内…

程序猿
2025年12月23日
2000
好文分享

visual怎么创建html5_VS新建HTML File选HTML5模板快速创建页面【创建】

可在Visual Studio中通过新建文件选HTML5模板、新建ASP.NET Core Web App项目或手动创建.html文件并输入及html:5代码段三种方式快速生成HTML5网页。如果您在 Visual Studio 中需要快速创建一个符合 HTML5 标准的网页文件，则可通过新建项目…

程序猿
2025年12月23日
0000
好文分享

html如何设置新版本_为HTML页面设置版本更新提示【提示】

可通过meta标签检测、Service Worker监听、Last-Modified头比对、manifest.json校验四种方式提示HTML页面新版本更新。如果您希望用户在访问HTML页面时获知存在新版本并提示更新，可以通过客户端缓存控制与版本标识机制触发提示行为。以下是实现该功能的多种方法： …

程序猿
2025年12月23日
0000
好文分享

html如何学好_学好HTML的关键点与练习【关键】

学好HTML需掌握基础语法结构、熟记语义化标签、通过真实项目练习、验证代码规范性并拆解优质网页源码。具体包括：标准HTML5骨架、正确使用header/nav/main等标签、构建个人页与新闻页、W3C校验及阅读mozilla.org源码。如果您希望掌握HTML语言并能熟练构建网页结构，则需要聚焦…

程序猿
2025年12月23日
1000
好文分享

html5怎么交css_html5用link外链或style内嵌引入css样式生效【引入】

CSS样式未生效时，应依次检查link外链路径与MIME类型、style内嵌位置与语法、行内style属性格式，并通过开发者工具的Elements、Styles和Computed面板验证加载与优先级。如果您在HTML5文档中尝试引入CSS样式但页面未按预期渲染，则可能是由于CSS引入方式不正确或路…

程序猿
2025年12月23日
0000