合并Pandas groupby聚合结果并进行分组条形图可视化

程序猿 • 2025年12月14日 15:18:01 • 用户投稿 • 阅读 1

本教程详细介绍了如何将Pandas groupby操作生成的不同聚合结果（如平均值和总和）合并到同一张图表中进行可视化。通过先将聚合后的数据框合并，然后利用Matplotlib的bar或barh函数，可以实现对复杂分组数据的多指标对比分析，有效解决直接链式调用绘图函数无法实现分组对比的问题。

在数据分析过程中，我们经常需要对数据集进行分组聚合，并对比同一分组下不同聚合指标的表现。例如，我们可能需要同时比较某个类别群体的平均值和总和。虽然pandas提供了便捷的groupby().plot.barh()方法，但它通常用于绘制单个聚合指标的图表。当我们需要在同一图表中并排展示多个聚合指标时，就需要更灵活的绘图策略。

挑战：直接绘制多个聚合结果

考虑以下两种独立的聚合操作，它们分别计算了不同维度组合下的cnt（计数）的平均值和总和：

import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 假设 day_df 是您的原始DataFrame，包含 'yr', 'season', 'weathersit', 'cnt' 等列# 为了示例，我们创建一个模拟的 day_dfdata = {    'yr': [0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1],    'season': [1, 1, 2, 2, 1, 1, 2, 2, 1, 1, 2, 2, 1, 1, 2, 2],    'weathersit': [1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2],    'cnt': [100, 150, 200, 250, 300, 350, 400, 450, 110, 160, 210, 260, 310, 360, 410, 460]}day_df = pd.DataFrame(data)# 单独的聚合和绘图尝试# day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "sum"}).plot.barh()# day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "mean"}).plot.barh()

直接对这两个聚合结果分别调用.plot.barh()会生成两张独立的图表，无法进行直观的并排比较。尝试手动使用plt.bar函数，但如果数据准备不当，例如直接从多级索引的DataFrame中提取列，会导致索引错位或数据无法匹配的问题。

解决方案：合并聚合数据框并使用Matplotlib绘图

解决此问题的核心在于：首先将不同聚合指标的数据整合到一个统一的DataFrame中，然后利用Matplotlib的灵活性来绘制分组条形图。

1. 数据准备：聚合与合并

首先，我们需要对原始数据进行两次聚合，分别计算所需的指标（例如，总和和平均值），并将结果转换为普通的DataFrame，以便后续合并。reset_index()在此步骤中至关重要，它将多级索引转换为普通列，使得数据框可以基于这些列进行合并。

# 计算平均值并重置索引day_mean_dataframe = day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "mean"}).reset_index()# 计算总和并重置索引day_sum_dataframe = day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "sum"}).reset_index()# 合并数据框# 使用 `on` 参数指定合并键，`suffixes` 参数处理同名列的后缀merged_df = pd.merge(day_mean_dataframe, day_sum_dataframe, on=["yr", "season", "weathersit"], suffixes=('_mean', '_sum'))print("合并后的数据框 (merged_df):")print(merged_df)

merged_df现在包含了每个分组的平均值（cnt_mean）和总和（cnt_sum），为后续的统一绘图奠定了基础。

2. 绘制分组条形图（垂直方向）

使用Matplotlib的plt.subplots创建图表和坐标轴对象，然后利用ax.bar函数绘制分组条形图。关键在于为不同指标的条形图设置不同的x轴位置偏移量，使其并排显示。

# 创建图表和坐标轴对象fig, ax = plt.subplots(figsize=(14, 7)) # 调整图表大小以适应更多标签# 计算每个分组的条形图的基准位置r1 = np.arange(len(merged_df))width = 0.35 # 条形图的宽度# 绘制平均值条形图ax.bar(r1 - width/2, merged_df["cnt_mean"], width=width, label='平均值', color='skyblue')# 绘制总和条形图，并向右偏移ax.bar(r1 + width/2, merged_df["cnt_sum"], width=width, label='总和', color='lightcoral')# 设置x轴刻度标签# 将多级分组键组合成一个字符串作为标签ax.set_xticks(r1)ax.set_xticklabels([f'年:{row.yr}, 季:{row.season}, 天气:{row.weathersit}' for _, row in merged_df.iterrows()], rotation=45, ha='right')# 添加图例和标题ax.legend()ax.set_xlabel('分组')ax.set_ylabel('计数')ax.set_title('各分组计数平均值与总和对比 (垂直条形图)')plt.tight_layout() # 调整布局以避免标签重叠plt.show()

3. 绘制分组条形图（水平方向）

对于分组标签较长或分组数量较多的情况，水平条形图（ax.barh）通常能提供更好的可读性。其原理与垂直条形图类似，只是交换了x轴和y轴的角色。

# 创建图表和坐标轴对象fig, ax = plt.subplots(figsize=(14, 8)) # 调整图表大小# 计算每个分组的条形图的基准位置r1 = np.arange(len(merged_df))height = 0.35 # 条形图的高度# 绘制平均值条形图ax.barh(r1 - height/2, merged_df["cnt_mean"], height=height, label='平均值', color='skyblue')# 绘制总和条形图，并向上偏移ax.barh(r1 + height/2, merged_df["cnt_sum"], height=height, label='总和', color='lightcoral')# 设置y轴刻度标签ax.set_yticks(r1)ax.set_yticklabels([f'年:{row.yr}, 季:{row.season}, 天气:{row.weathersit}' for _, row in merged_df.iterrows()])# 添加图例和标题ax.legend()ax.set_xlabel('计数')ax.set_ylabel('分组')ax.set_title('各分组计数平均值与总和对比 (水平条形图)')plt.tight_layout() # 调整布局plt.show()

注意事项与最佳实践

reset_index() 的重要性：在groupby().agg()之后，结果通常是一个多级索引的Series或DataFrame。reset_index()将其转换为普通的DataFrame，并将索引级别转换为常规列，这对于后续的pd.merge()操作至关重要。suffixes 参数：在pd.merge()中，如果两个DataFrame有同名的非合并列，suffixes参数可以为这些列添加不同的后缀，避免列名冲突，例如cnt_mean和cnt_sum。标签处理：当分组键包含多个维度时，如yr, season, weathersit，需要手动将它们组合成一个有意义的字符串作为刻度标签，以提高可读性。rotation和ha（horizontal alignment）参数可以帮助调整长标签的显示。图表尺寸与布局：使用figsize调整图表大小，特别是当分组数量较多或标签较长时。plt.tight_layout()可以自动调整子图参数，使之填充整个图表区域，避免标签重叠。颜色和图例：合理使用颜色区分不同的指标，并添加清晰的图例，有助于读者理解图表内容。选择条形图方向：垂直条形图 (ax.bar) 适用于分组数量较少、分组标签较短的情况。水平条形图 (ax.barh) 适用于分组数量较多、分组标签较长的情况，可以有效避免标签重叠，提高可读性。

总结

通过将Pandas的groupby聚合结果与pd.merge相结合，我们能够有效地整合来自不同聚合操作的数据。随后，利用Matplotlib提供的强大绘图功能，我们可以灵活地创建分组条形图，无论是垂直还是水平方向，都能清晰地展示多指标在同一分组下的对比情况。这种方法不仅解决了直接链式绘图的局限性，也为更复杂的数据可视化提供了坚实的基础。

以上就是合并Pandas groupby聚合结果并进行分组条形图可视化的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1375755.html

igs 数据可视化

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

优化Python矩阵运算：提升与Matlab媲美的性能

上一篇 2025年12月14日 15:17:55

Python列表推导式中的外部变量修改限制与高效计数方法

下一篇 2025年12月14日 15:18:10

Matplotlib 地图中多类型图例的创建与优化

本教程旨在解决matplotlib地图可视化中，如何在一个图例中同时展示颜色块（如区域分类）和自定义标记（如特定兴趣点）的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时，如何利用`matplotlib.lines.line2d`创建标记图例句柄，并将其与颜色块图例句柄合并，从而生成一…

程序猿
2026年5月10日 • 用户投稿
9000
用户投稿

使用 Jupyter Notebook 进行探索性数据分析

Jupyter Notebook通过单元格实现代码与Markdown结合，支持数据导入（pandas）、清洗（fillna）、探索（matplotlib/seaborn可视化）、统计分析（describe/corr）和特征工程，便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

程序猿
2026年5月10日
0000
用户投稿

HTML结构错误解析与W3C验证器指南

本文旨在深入解析常见的html结构错误，特别是涉及` `、“和` `元素的不当使用，这些错误常导致w3c验证器报错。我们将详细阐述这些元素的正确语义和放置规则，解释隐式闭合机制如何引发验证问题，并通过实际代码示例展示如何构建符合标准、易于维护的html文档，从而提升网页的兼容性和可访问性…

程序猿
2026年5月10日
0000
用户投稿

SVG动态图形：实现路径与圆形元素的振动效果

本教程详细介绍了如何利用SVG的SMIL动画功能，为线条和圆形元素创建生动的振动或摆动效果。我们将学习如何将直线转换为可动画的路径，并同步动画圆形元素的位置，以及如何将图像嵌入到动态圆形中，为您的SVG图形注入生命力，使其不再是静态的图像。在svg中，为图形元素添加动态效果是提升用户体验和视觉吸引…

程序猿
2026年5月10日
0000
用户投稿

Chart.js多轴混合图表实现指南：结合柱状图与折线图并正确配置轴标签

本文详细介绍了如何使用chart.js创建包含柱状图和折线图的多轴混合图表。重点阐述了数据结构定义、自定义背景图案函数以及chart.js scales配置项的正确使用，特别是如何为不同数据集分配独立的y轴，并确保轴标签的正确显示和定位，从而解决多轴图表配置中的常见问题。在数据可视化中，我们经常需…

程序猿
2026年5月10日
0000
用户投稿

HTML5Canvas怎么画图_HTML5Canvas元素绘制图形的基本方法与实例

Canvas通过JavaScript绘制图形，需先创建画布并获取2D上下文；使用fillRect、strokeRect绘矩形，arc绘圆，lineTo连线，结合fillStyle等设样式；示例绘制了黄色笑脸，包含眼嘴，体现其在图形与动画中的灵活性。 HTML5 中的 Canvas 元素提供了一个通过…

程序猿
2026年5月10日
0000
用户投稿

如何将一组数值规范化到0-1范围：基于最大值的权重计算

本教程详细介绍了如何将一组数值规范化到0-1的范围，其中最小值映射到0（或接近0），最大值映射到1。通过将每个数值除以集合中的最大值来实现，这在需要根据相对大小而非总和百分比来表示数据（如css透明度）时非常有用。引言：理解数值规范化需求在数据处理和前端开发中，我们经常需要将一组原始数值转换到一…

程序猿
2026年5月10日
0000
用户投稿

如何用Python进行数据可视化（Matplotlib/Seaborn）？

在Python中进行数据可视化，Matplotlib和Seaborn无疑是两大基石。简单来说，Matplotlib提供了绘图的底层控制和高度的定制化能力，就像一个万能的画板和各种画笔；而Seaborn则在此基础上进行了封装和优化，尤其擅长统计图表，它像一位经验丰富的艺术家，能用更少的指令绘制出美观且…

程序猿
2026年5月10日
0000
使用Jinja2与Python动态加载并显示多张图片到HTML

本文详细介绍了如何利用Jinja2模板引擎与Python后端，高效地将多张图片动态加载并渲染到HTML页面中。核心方法在于将图片数据组织成一个包含字典的列表，其中每个字典代表一张图片及其属性（如标题和文件路径），并通过Jinja2的`for`循环在HTML模板中迭代渲染，从而实现灵活且可维护的多图片…

程序猿
2026年5月10日 • 用户投稿
1000
用户投稿

在数据可视化中，如何利用 D3.js 进行复杂的数据绑定和 DOM 操作？

D3.js的核心优势在于数据绑定与DOM操作的精细控制，通过enter、update、exit模式实现数据驱动的动态更新；利用data join机制将数据与元素关联，支持嵌套绑定、分组操作及过渡动画，并通过key函数和选择集复用提升性能，从而构建高效响应式可视化。在数据可视化中，D3.js 的核心…

程序猿
2026年5月10日
0000
用户投稿

如何构建一个高性能的、基于Canvas的JavaScript数据可视化组件？

答案：通过按需渲染、减少上下文操作和高效交互检测实现高性能Canvas可视化。使用isDirty标记控制重绘，合并路径绘制，预存静态图层，结合devicePixelRatio适配高清屏，利用空间索引与节流优化交互响应，避免全量刷新，提升性能。构建一个高性能的基于 Canvas 的 JavaScri…

程序猿
2026年5月10日
1000
用户投稿

html5 圆形怎么画_HTML5用border-radius:50%或SVG circle画正圆【绘制】

HTML5提供三种原生绘制正圆方法：一、CSS border-radius:50%适用于等宽高div；二、SVG circle元素通过cx/cy/r精确定义矢量圆；三、Canvas arc()方法用JavaScript像素级绘制动态圆。如果您希望在网页中绘制一个完美的正圆形，HTML5 提供了多种…

程序猿
2025年12月23日
9000
用户投稿

Flexbox中实现首元素左对齐，其余元素右对齐的高效方法

本教程将深入探讨在flexbox布局中，如何不使用额外包装器，仅通过巧妙运用css的`margin-left: auto`属性，实现将首个元素固定在容器左侧，而将其余所有兄弟元素推向右侧的布局技巧。通过具体代码示例和原理分析，帮助开发者高效解决常见的导航栏或列表元素分离对齐问题。在构建现代网页布局…

程序猿
2025年12月23日
0000
用户投稿

根据文本内容动态设置元素背景色的JavaScript教程

本教程旨在详细讲解如何使用javascript动态地根据html元素（如`div`标签）的文本内容来改变其背景颜色。文章将通过具体的代码示例，展示如何获取特定类的所有元素、遍历它们，并根据其内部文本值应用不同的样式，最终实现在页面加载时自动执行此功能，从而提升网页的交互性和信息展示能力。概述在网…

程序猿
2025年12月23日
0000
用户投稿

Flexbox布局中实现首元素左对齐与其余元素右对齐的技巧

本文详细介绍了在css flexbox布局中，如何不依赖额外包装元素，仅通过一行css代码实现首个子元素左对齐，而其余所有子元素自动向右对齐的效果。核心技巧在于利用`margin-left: auto;`属性，巧妙地分配flex容器中的剩余空间，从而实现元素的左右分离对齐，优化布局结构。在现代网页…

程序猿
2025年12月23日
0000
用户投稿

SVG描边锥形渐变实现指南：利用CSS与SVG遮罩技术

本文详细探讨了在svg元素描边上实现锥形渐变效果的方法。鉴于svg原生渐变（线性或径向）难以直接创建真锥形渐变，教程重点介绍了一种结合css `conic-gradient`和svg “的创新技术。通过将css锥形渐变作为svg背景，并利用svg遮罩精确控制渐变仅在描边区域显示，从而实现…

程序猿
2025年12月23日
0000
用户投稿

Flexbox布局中实现首元素左对齐与其余元素右对齐

本文将详细介绍在flexbox布局中，如何不使用额外的包装器，仅通过css实现首个子元素左对齐，而其余子元素右对齐的布局效果。核心技巧在于利用`margin-left: auto;`将第二个元素及其后续兄弟元素推向容器的右侧，从而实现灵活且高效的两端对齐布局。引言：Flexbox布局中的两端对齐挑…

程序猿
2025年12月23日
0000
用户投稿

Chart.js v3：程序化动态修改Y轴标签的实用指南

本文详细介绍了在chart.js v3中如何通过编程方式动态修改图表y轴的标签文本。核心在于正确访问chart实例的配置对象路径`mychart.options.scales.y.title.text`，并确保标签的`display`属性设置为`true`，最后通过调用`mychart.update…

程序猿
2025年12月23日
1000
用户投稿

Chart.js v3 动态修改 Y 轴标题的专业指南

本教程详细阐述了在 chart.js v3 中动态修改 y 轴标题的正确方法。通过访问 `mychart.options.scales.y.title.text` 属性并确保 `title.display` 为 `true`，开发者可以轻松更新轴标签。文章将提供清晰的代码示例，并强调 `mychar…

程序猿
2025年12月23日
0000
用户投稿

Chart.js v3：程序化动态修改Y轴标题的实用指南

本教程详细介绍了在chart.js v3中如何程序化地动态修改图表y轴的标题。文章将指出常见的错误方法，并提供正确的api路径`mychart.options.scales.y.title.text`，强调确保标题显示 (`display: true`) 和调用 `mychart.update()`…

程序猿
2025年12月23日
1000