高效 Pandas 数据聚合：计算分组百分比利用率

程序猿 • 2025年12月14日 10:14:58 • 用户投稿 • 阅读 0

本文旨在介绍如何使用 Pandas 库高效地对 DataFrame 进行分组聚合，并计算特定指标的百分比利用率。通过 groupby() 和 transform() 方法，避免使用低效的 apply() 函数，实现更快速、简洁的数据处理。我们将以计算设备带宽利用率为例，演示具体操作步骤和代码示例。

使用 Pandas 进行高效分组聚合和百分比计算

Pandas 提供了强大的数据处理功能，其中分组聚合是数据分析中常用的操作。当需要计算每个分组内的特定指标的百分比时，可以使用 groupby() 和 transform() 方法高效地实现。本文将详细介绍如何使用这些方法，并避免使用效率较低的 apply() 函数。

数据准备

首先，我们需要创建一个 Pandas DataFrame 作为示例数据。以下代码创建了一个包含设备名称、接口信息、输入输出流量和带宽使用情况的 DataFrame：

import pandas as pddata = {'Device': ['Usa123', 'Usa123', 'Emea01', 'Emea01'],        'int': ['Eth1', 'Eth0', 'Wan1', 'Eth3'],        'In': [1000, 10000, 1000, 2000],        'Out': [500, 700, 500, 1000],        'Bw_in': [100, 200, 150, 200],        'Bw_out': [75, 80, 90, 70]}df = pd.DataFrame(data)print(df)

输出：

  Device   int     In   Out  Bw_in  Bw_out0  Usa123  Eth1   1000   500    100      751  Usa123  Eth0  10000   700    200      802  Emea01  Wan1   1000   500    150      903  Emea01  Eth3   2000  1000    200      70

计算分组百分比利用率

我们的目标是计算每个设备的输入和输出带宽利用率，即 Bw_in / In 和 Bw_out / Out 的总和，并将其添加到 DataFrame 中。可以使用以下代码实现：

g = df.groupby("Device")df[["%InUsage", "%OutUsage"]] = (    g[["Bw_in", "Bw_out"]].transform("sum")    / g[["In", "Out"]].transform("sum").to_numpy())print(df)

输出：

  Device   int     In   Out  Bw_in  Bw_out  %InUsage  %OutUsage0  Usa123  Eth1   1000   500    100      75  0.027273   0.1291671  Usa123  Eth0  10000   700    200      80  0.027273   0.1291672  Emea01  Wan1   1000   500    150      90  0.116667   0.1066673  Emea01  Eth3   2000  1000    200      70  0.116667   0.106667

代码解释：

df.groupby(“Device”): 按照 “Device” 列进行分组，创建一个 DataFrameGroupBy 对象。g[[“Bw_in”, “Bw_out”]].transform(“sum”): 对每个分组内的 “Bw_in” 和 “Bw_out” 列分别求和。transform(“sum”) 方法会将求和结果广播到每个分组内的每一行，保持 DataFrame 的原始形状。g[[“In”, “Out”]].transform(“sum”): 类似地，对每个分组内的 “In” 和 “Out” 列分别求和，并将结果广播到每一行。.to_numpy(): 将 g[[“In”, “Out”]].transform(“sum”) 转换为 NumPy 数组，以便进行广播除法。/: 将带宽使用总和除以总流量，计算百分比利用率。df[[“%InUsage”, “%OutUsage”]] = …: 将计算结果赋值给 DataFrame 的新列 “%InUsage” 和 “%OutUsage”。

避免使用 apply()

虽然可以使用 apply() 函数实现相同的功能，但 transform() 方法通常更高效，因为它利用了 Pandas 的内部优化。apply() 函数通常在循环中逐行或逐列应用函数，而 transform() 方法可以对整个分组进行批量操作。

以下是使用 apply() 的示例代码（不推荐）：

# 不推荐使用def calculate_usage(x):    in_usage = x['Bw_in'].sum() / x['In'].sum()    out_usage = x['Bw_out'].sum() / x['Out'].sum()    return pd.Series({'%InUsage': in_usage, '%OutUsage': out_usage})df[['%InUsage', '%OutUsage']] = df.groupby('Device').apply(calculate_usage)

总结

本文介绍了如何使用 Pandas 库高效地进行分组聚合，并计算特定指标的百分比利用率。通过 groupby() 和 transform() 方法，可以避免使用低效的 apply() 函数，实现更快速、简洁的数据处理。 transform() 方法的优势在于它可以将聚合结果广播到每个分组内的每一行，从而避免了显式循环，提高了代码效率。在处理大型数据集时，这种优化尤为重要。

以上就是高效 Pandas 数据聚合：计算分组百分比利用率的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1370106.html

app

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Pandas DataFrame 数据聚合：高效计算分组百分比

上一篇 2025年12月14日 10:14:50

如何用Python实现一个命令行工具？

下一篇 2025年12月14日 10:15:06

好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

html5 js怎么加_html5用script标签内嵌或外链引入JS代码【添加】

在HTML5中执行JavaScript需通过script标签：一、内联编写于head或body中；二、外链引入.js文件并建议放body末尾或加defer；三、defer按序执行，async独立执行；四、可动态创建script元素插入执行。如果您希望在HTML5页面中执行JavaScript代码，…

程序猿
2025年12月23日
0000
好文分享

node.js怎么运行html_node.js运行html步骤【指南】

答案是使用Node.js内置http模块、Express框架或第三方工具serve可快速搭建服务器预览HTML文件。首先通过http模块创建服务器并读取index.html返回响应；其次用Express初始化项目并配置静态文件服务；最后利用serve工具全局安装后一键启动服务器，三种方式均在浏览器访…

程序猿
2025年12月23日
4000
好文分享

html5能否插入带表单的文档_html5表单文档嵌入与数据提交【步骤】

HTML5中无法直接嵌入外部带表单的HTML文档并原生提交；可行方案有四：一、用iframe嵌入，需同源或CORS支持，并用postMessage通信；二、用fetch+DOMParser动态加载表单片段并手动绑定事件；三、在当前页面直接编写表单，最规范且兼容性好；四、用JavaScript+fet…

程序猿
2025年12月23日
1000
好文分享

360怎么装html5_360浏览器默认支持HTML5无需额外安装设置【说明】

HTML5是网页标准，非独立软件，360浏览器7.0+已原生支持；需确认内核为Blink/Chromium、关闭兼容模式、禁用强制兼容策略、重置Flash插件、清除HTML5本地存储、检查系统Media Foundation组件。如果您在使用360浏览器时发现HTML5网页功能异常（如视频无法播放…

程序猿
2025年12月23日
4000
好文分享

html如何滑动_实现HTML页面或元素滑动效果【效果】

可通过CSS scroll-behavior实现平滑锚点跳转，JavaScript scrollTo精确控制滚动位置，CSS transform模拟高性能滑动动画，或使用Swiper等第三方库实现触摸拖拽、循环播放等高级交互功能。如果您希望在网页中实现页面或特定元素的滑动效果，可以通过CSS和Ja…

程序猿
2025年12月23日
0000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
3000
好文分享

html5能否让搜索框随滚动固定_html5positionfixed固定布局【攻略】

可使用CSS的position: fixed实现搜索框固定定位，或用position: sticky实现边界感知粘性效果，配合JavaScript动态控制、响应式适配及占位修复，确保滚动时稳定显示。如果您希望在网页滚动过程中让搜索框始终保持在可视区域的固定位置，HTML5 本身不提供直接的布局控制…

程序猿
2025年12月23日
3000
好文分享

如何操作html_操作HTML元素的常用方法【常用】

必须掌握操作HTML元素的五种核心方法：一、通过ID精准获取并修改单个元素；二、通过类名批量操作多个元素；三、用querySelector系列灵活选择任意CSS匹配元素；四、动态创建并插入新元素；五、安全移除或替换现有元素。如果您需要动态修改网页内容或响应用户交互，则必须掌握操作HTML元素的核心…

程序猿
2025年12月23日
9000
好文分享

html5框架怎么设置_HTML5用iframe或div框架集嵌入子页面设框架【设置】

HTML5中嵌入子页面的现代方案有四种：一、用iframe标签直接嵌入，支持安全与可访问性属性；二、用CSS Grid/Flexbox布局配合JavaScript动态加载HTML片段；三、用Shadow DOM封装自定义元素实现样式脚本隔离；四、用object标签嵌入HTML并提供fallback内…

程序猿
2025年12月23日
2000
好文分享

visual怎么创建html5_VS新建HTML File选HTML5模板快速创建页面【创建】

可在Visual Studio中通过新建文件选HTML5模板、新建ASP.NET Core Web App项目或手动创建.html文件并输入及html:5代码段三种方式快速生成HTML5网页。如果您在 Visual Studio 中需要快速创建一个符合 HTML5 标准的网页文件，则可通过新建项目…

程序猿
2025年12月23日
0000
好文分享

html如何设置新版本_为HTML页面设置版本更新提示【提示】

可通过meta标签检测、Service Worker监听、Last-Modified头比对、manifest.json校验四种方式提示HTML页面新版本更新。如果您希望用户在访问HTML页面时获知存在新版本并提示更新，可以通过客户端缓存控制与版本标识机制触发提示行为。以下是实现该功能的多种方法： …

程序猿
2025年12月23日
0000
jimdo怎样用html5做图片放大镜_jimdo图片放大镜html5实现与放大倍数【实操】

可在 Jimdo 网站通过四种方式实现图片放大镜效果：一、纯 HTML5+CSS3+JS 实现 canvas 局部放大；二、集成 magnific-popup 插件支持弹窗缩放；三、纯 CSS hover 缩放模拟；四、利用 data-zoom 属性动态触发 canvas 放大。如果您在 Jimd…

程序猿
2025年12月23日 • 好文分享
0000
好文分享

android 怎么用html5_安卓用WebView加载html5页面或开发混合应用【使用】

Android中WebView集成需四步：一、声明权限与控件并加载HTML；二、启用JavaScript及HTML5特性；三、通过assets目录加载本地资源；四、用addJavascriptInterface实现JS与Java通信，并手动管理生命周期。 2、在布局文件（如 activity_mai…

程序猿
2025年12月23日
0000
好文分享

html5如何清除缓存_HTML5缓存清除步骤与清理浏览器缓存方法【教程】

HTML5网页应用异常通常由浏览器缓存旧资源导致，需依次清除常规缓存、强制刷新、清理AppCache、注销Service Worker并清空其缓存、或用无痕模式验证。如果您在使用HTML5网页应用时遇到内容未更新、页面显示异常或资源加载错误等问题，可能是由于浏览器缓存了旧版本的HTML、CSS、J…

程序猿
2025年12月23日
0000
好文分享

html5怎么加元素_HT5用JS createElement或innerHTML添加新元素【添加】

HTML5中动态添加元素有四种方法：一、createElement创建并配置元素后追加；二、innerHTML直接插入或替换HTML字符串；三、insertAdjacentHTML在指定位置插入HTML；四、DocumentFragment批量添加以提升性能。如果您希望在HTML5页面中动态添加新…

程序猿
2025年12月23日
1000
好文分享

flash怎么变为html5_用Swiffy或CreateJS将Flash动画转HTML5【转换】

可采用四种方法迁移Flash动画至HTML5：一、用Swiffy转换SWF为Canvas/JS；二、用CreateJS从Animate导出HTML5 Canvas；三、用Lottie+Bodymovin将AE版动画转JSON播放；四、用Ruffle模拟器直接运行原SWF。如果您希望将现有的Flas…

程序猿
2025年12月23日
1000
好文分享

app html5 怎么静音_HTML5用audio/video muted属性或JS设静音【静音】

HTML5音视频静音可通过muted属性、JavaScript动态控制、setAttribute方法、MutationObserver监听及处理自动播放策略实现：直接添加muted属性默认静音；JS设media.muted=true/false；setAttribute(‘muted&#…

程序猿
2025年12月23日
0000
好文分享

html5能否插入xml文档_html5xml嵌入与节点解析展示【攻略】

需用JavaScript加载解析XML：一、XMLHttpRequest异步获取并解析；二、DOMParser解析内联XML字符串；三、fetch API配合DOMParser处理；四、XMLSerializer序列化调试；五、getElementsByTagNameNS处理命名空间。如果您希望在…

程序猿
2025年12月23日
3000
好文分享

怎么上传图片html5_html5用FormData或input file上传图片到服务器【上传】

可通过HTML5的FormData与file输入框结合XMLHttpRequest或fetch实现图片上传：一、XMLHttpRequest方式需创建FormData并手动配置xhr；二、fetch方式以Promise风格简化异步流程；三、启用multiple属性可批量上传；四、配合FileRead…

程序猿
2025年12月23日
0000