Pandas DataFrame 数据聚合：高效计算分组百分比

程序猿 • 2025年12月14日 10:14:50 • 好文分享 • 阅读 0

本文旨在介绍如何使用 Pandas DataFrame 对数据进行分组聚合，并计算特定列的百分比。我们将通过一个实际案例，演示如何按设备 (Device) 对带宽使用情况 (Bw_in, Bw_out) 进行汇总，并计算其占总流量 (In, Out) 的百分比，从而高效地实现数据分析目标。

使用 groupby() 和 transform() 进行数据聚合

在 Pandas 中，groupby() 函数允许你根据一个或多个列的值将 DataFrame 分组。然后，你可以对每个组应用聚合函数，例如 sum()、mean()、count() 等。 transform() 函数则允许我们将聚合后的值广播回原始 DataFrame，这对于计算百分比等需要比较每个组内值与组总和的情况非常有用。

示例：

假设我们有以下 DataFrame：

import pandas as pddata = {'Device': ['Usa123', 'Usa123', 'Emea01', 'Emea01'],        'int': ['Eth1', 'Eth0', 'Wan1', 'Eth3'],        'In': [1000, 10000, 1000, 2000],        'Out': [500, 700, 500, 1000],        'Bw_in': [100, 200, 150, 200],        'Bw_out': [75, 80, 90, 70]}df = pd.DataFrame(data)print(df)

输出：

  Device   int     In   Out  Bw_in  Bw_out0  Usa123  Eth1   1000   500    100      751  Usa123  Eth0  10000   700    200      802  Emea01  Wan1   1000   500    150      903  Emea01  Eth3   2000  1000    200      70

现在，我们要计算每个设备的 %InUsage 和 %OutUsage，计算公式如下：

%InUsage = Bw_in 总和 / In 总和 (按设备分组)%OutUsage = Bw_out 总和 / Out 总和 (按设备分组)

我们可以使用以下代码实现：

g = df.groupby("Device")df[["%InUsage", "%OutUsage"]] = (    g[["Bw_in", "Bw_out"]].transform("sum")    / g[["In", "Out"]].transform("sum").to_numpy())print(df)

代码解释：

g = df.groupby(“Device”): 这行代码根据 ‘Device’ 列对 DataFrame 进行分组，并将分组后的对象存储在变量 g 中。g[[“Bw_in”, “Bw_out”]].transform(“sum”): 这行代码对每个设备组的 ‘Bw_in’ 和 ‘Bw_out’ 列求和。transform(“sum”) 函数将计算得到的每个组的总和广播回原始 DataFrame，保持与原始 DataFrame 相同的索引。g[[“In”, “Out”]].transform(“sum”).to_numpy(): 这行代码对每个设备组的 ‘In’ 和 ‘Out’ 列求和，然后使用 .to_numpy() 将结果转换为 NumPy 数组。这是因为 Pandas Series 和 DataFrame 在进行除法运算时，会进行索引对齐。为了避免索引对齐带来的潜在问题，我们将除数转换为 NumPy 数组。df[[“%InUsage”, “%OutUsage”]] = …: 这行代码将计算得到的 %InUsage 和 %OutUsage 添加到原始 DataFrame 中。

输出结果：

  Device   int     In   Out  Bw_in  Bw_out  %InUsage  %OutUsage0  Usa123  Eth1   1000   500    100      75  0.027273   0.1291671  Usa123  Eth0  10000   700    200      80  0.027273   0.1291672  Emea01  Wan1   1000   500    150      90  0.116667   0.1066673  Emea01  Eth3   2000  1000    200      70  0.116667   0.106667

注意事项

确保用于分组的列（例如，这里的 ‘Device’）包含正确的数据类型。在进行除法运算时，要处理除数为零的情况，避免出现 ZeroDivisionError。可以使用 fillna(0) 将 NaN 值替换为 0。理解 transform() 函数的作用，它将聚合结果广播回原始 DataFrame，这使得我们可以方便地进行后续计算。使用 .to_numpy() 将 Pandas Series 转换为 NumPy 数组，避免索引对齐问题，提高代码的健壮性。

总结

本文介绍了如何使用 Pandas 的 groupby() 和 transform() 函数对 DataFrame 进行分组聚合，并计算特定列的百分比。通过示例代码和详细解释，展示了如何高效地处理数据，并获得所需的结果。这种方法避免了使用 apply 函数，从而提高了代码的执行效率。掌握这些技巧可以帮助你更好地进行数据分析和处理。

以上就是Pandas DataFrame 数据聚合：高效计算分组百分比的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1370104.html

app 聚合函数

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

functools 模块中的 lru_cache 和 wraps

上一篇 2025年12月14日 10:14:42

高效 Pandas 数据聚合：计算分组百分比利用率

下一篇 2025年12月14日 10:14:58

好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

在HTML5中执行JavaScript需通过script标签：一、内联编写于head或body中；二、外链引入.js文件并建议放body末尾或加defer；三、defer按序执行，async独立执行；四、可动态创建script元素插入执行。如果您希望在HTML5页面中执行JavaScript代码，…

程序猿
2025年12月23日
0000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
4000
好文分享

html5能否插入带表单的文档_html5表单文档嵌入与数据提交【步骤】

HTML5中无法直接嵌入外部带表单的HTML文档并原生提交；可行方案有四：一、用iframe嵌入，需同源或CORS支持，并用postMessage通信；二、用fetch+DOMParser动态加载表单片段并手动绑定事件；三、在当前页面直接编写表单，最规范且兼容性好；四、用JavaScript+fet…

程序猿
2025年12月23日
1000
好文分享

360怎么装html5_360浏览器默认支持HTML5无需额外安装设置【说明】

HTML5是网页标准，非独立软件，360浏览器7.0+已原生支持；需确认内核为Blink/Chromium、关闭兼容模式、禁用强制兼容策略、重置Flash插件、清除HTML5本地存储、检查系统Media Foundation组件。如果您在使用360浏览器时发现HTML5网页功能异常（如视频无法播放…

程序猿
2025年12月23日
4000
好文分享

html如何滑动_实现HTML页面或元素滑动效果【效果】

可通过CSS scroll-behavior实现平滑锚点跳转，JavaScript scrollTo精确控制滚动位置，CSS transform模拟高性能滑动动画，或使用Swiper等第三方库实现触摸拖拽、循环播放等高级交互功能。如果您希望在网页中实现页面或特定元素的滑动效果，可以通过CSS和Ja…

程序猿
2025年12月23日
0000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
3000
好文分享

html5能否让搜索框随滚动固定_html5positionfixed固定布局【攻略】

可使用CSS的position: fixed实现搜索框固定定位，或用position: sticky实现边界感知粘性效果，配合JavaScript动态控制、响应式适配及占位修复，确保滚动时稳定显示。如果您希望在网页滚动过程中让搜索框始终保持在可视区域的固定位置，HTML5 本身不提供直接的布局控制…

程序猿
2025年12月23日
2000
好文分享

如何操作html_操作HTML元素的常用方法【常用】

必须掌握操作HTML元素的五种核心方法：一、通过ID精准获取并修改单个元素；二、通过类名批量操作多个元素；三、用querySelector系列灵活选择任意CSS匹配元素；四、动态创建并插入新元素；五、安全移除或替换现有元素。如果您需要动态修改网页内容或响应用户交互，则必须掌握操作HTML元素的核心…

程序猿
2025年12月23日
9000
好文分享

html5框架怎么设置_HTML5用iframe或div框架集嵌入子页面设框架【设置】

HTML5中嵌入子页面的现代方案有四种：一、用iframe标签直接嵌入，支持安全与可访问性属性；二、用CSS Grid/Flexbox布局配合JavaScript动态加载HTML片段；三、用Shadow DOM封装自定义元素实现样式脚本隔离；四、用object标签嵌入HTML并提供fallback内…

程序猿
2025年12月23日
2000
好文分享

visual怎么创建html5_VS新建HTML File选HTML5模板快速创建页面【创建】

可在Visual Studio中通过新建文件选HTML5模板、新建ASP.NET Core Web App项目或手动创建.html文件并输入及html:5代码段三种方式快速生成HTML5网页。如果您在 Visual Studio 中需要快速创建一个符合 HTML5 标准的网页文件，则可通过新建项目…

程序猿
2025年12月23日
0000
好文分享

html如何设置新版本_为HTML页面设置版本更新提示【提示】

可通过meta标签检测、Service Worker监听、Last-Modified头比对、manifest.json校验四种方式提示HTML页面新版本更新。如果您希望用户在访问HTML页面时获知存在新版本并提示更新，可以通过客户端缓存控制与版本标识机制触发提示行为。以下是实现该功能的多种方法： …

程序猿
2025年12月23日
0000
jimdo怎样用html5做图片放大镜_jimdo图片放大镜html5实现与放大倍数【实操】

可在 Jimdo 网站通过四种方式实现图片放大镜效果：一、纯 HTML5+CSS3+JS 实现 canvas 局部放大；二、集成 magnific-popup 插件支持弹窗缩放；三、纯 CSS hover 缩放模拟；四、利用 data-zoom 属性动态触发 canvas 放大。如果您在 Jimd…

程序猿
2025年12月23日 • 好文分享
0000
好文分享

android 怎么用html5_安卓用WebView加载html5页面或开发混合应用【使用】

Android中WebView集成需四步：一、声明权限与控件并加载HTML；二、启用JavaScript及HTML5特性；三、通过assets目录加载本地资源；四、用addJavascriptInterface实现JS与Java通信，并手动管理生命周期。 2、在布局文件（如 activity_mai…

程序猿
2025年12月23日
0000
好文分享

html5如何清除缓存_HTML5缓存清除步骤与清理浏览器缓存方法【教程】

HTML5网页应用异常通常由浏览器缓存旧资源导致，需依次清除常规缓存、强制刷新、清理AppCache、注销Service Worker并清空其缓存、或用无痕模式验证。如果您在使用HTML5网页应用时遇到内容未更新、页面显示异常或资源加载错误等问题，可能是由于浏览器缓存了旧版本的HTML、CSS、J…

程序猿
2025年12月23日
0000
好文分享

html5怎么加元素_HT5用JS createElement或innerHTML添加新元素【添加】

HTML5中动态添加元素有四种方法：一、createElement创建并配置元素后追加；二、innerHTML直接插入或替换HTML字符串；三、insertAdjacentHTML在指定位置插入HTML；四、DocumentFragment批量添加以提升性能。如果您希望在HTML5页面中动态添加新…

程序猿
2025年12月23日
1000
好文分享

flash怎么变为html5_用Swiffy或CreateJS将Flash动画转HTML5【转换】

可采用四种方法迁移Flash动画至HTML5：一、用Swiffy转换SWF为Canvas/JS；二、用CreateJS从Animate导出HTML5 Canvas；三、用Lottie+Bodymovin将AE版动画转JSON播放；四、用Ruffle模拟器直接运行原SWF。如果您希望将现有的Flas…

程序猿
2025年12月23日
1000
好文分享

app html5 怎么静音_HTML5用audio/video muted属性或JS设静音【静音】

HTML5音视频静音可通过muted属性、JavaScript动态控制、setAttribute方法、MutationObserver监听及处理自动播放策略实现：直接添加muted属性默认静音；JS设media.muted=true/false；setAttribute(‘muted&#…

程序猿
2025年12月23日
0000
好文分享

html5能否插入xml文档_html5xml嵌入与节点解析展示【攻略】

需用JavaScript加载解析XML：一、XMLHttpRequest异步获取并解析；二、DOMParser解析内联XML字符串；三、fetch API配合DOMParser处理；四、XMLSerializer序列化调试；五、getElementsByTagNameNS处理命名空间。如果您希望在…

程序猿
2025年12月23日
2000
好文分享

怎么上传图片html5_html5用FormData或input file上传图片到服务器【上传】

可通过HTML5的FormData与file输入框结合XMLHttpRequest或fetch实现图片上传：一、XMLHttpRequest方式需创建FormData并手动配置xhr；二、fetch方式以Promise风格简化异步流程；三、启用multiple属性可批量上传；四、配合FileRead…

程序猿
2025年12月23日
0000

发表回复

登录后才能评论

Pandas DataFrame 数据聚合：高效计算分组百分比

使用 groupby() 和 transform() 进行数据聚合

注意事项

总结

关于作者

相关推荐

发表回复