合并Pandas groupby聚合结果并进行分组条形图可视化

合并Pandas groupby聚合结果并进行分组条形图可视化

本教程详细介绍了如何将Pandas groupby操作生成的不同聚合结果(如平均值和总和)合并到同一张图表中进行可视化。通过先将聚合后的数据框合并,然后利用Matplotlib的bar或barh函数,可以实现对复杂分组数据的多指标对比分析,有效解决直接链式调用绘图函数无法实现分组对比的问题。

在数据分析过程中,我们经常需要对数据集进行分组聚合,并对比同一分组下不同聚合指标的表现。例如,我们可能需要同时比较某个类别群体的平均值和总和。虽然pandas提供了便捷的groupby().plot.barh()方法,但它通常用于绘制单个聚合指标的图表。当我们需要在同一图表中并排展示多个聚合指标时,就需要更灵活的绘图策略。

挑战:直接绘制多个聚合结果

考虑以下两种独立的聚合操作,它们分别计算了不同维度组合下的cnt(计数)的平均值和总和:

import pandas as pdimport matplotlib.pyplot as pltimport numpy as np# 假设 day_df 是您的原始DataFrame,包含 'yr', 'season', 'weathersit', 'cnt' 等列# 为了示例,我们创建一个模拟的 day_dfdata = {    'yr': [0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1],    'season': [1, 1, 2, 2, 1, 1, 2, 2, 1, 1, 2, 2, 1, 1, 2, 2],    'weathersit': [1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2, 1, 2],    'cnt': [100, 150, 200, 250, 300, 350, 400, 450, 110, 160, 210, 260, 310, 360, 410, 460]}day_df = pd.DataFrame(data)# 单独的聚合和绘图尝试# day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "sum"}).plot.barh()# day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "mean"}).plot.barh()

直接对这两个聚合结果分别调用.plot.barh()会生成两张独立的图表,无法进行直观的并排比较。尝试手动使用plt.bar函数,但如果数据准备不当,例如直接从多级索引的DataFrame中提取列,会导致索引错位或数据无法匹配的问题。

解决方案:合并聚合数据框并使用Matplotlib绘图

解决此问题的核心在于:首先将不同聚合指标的数据整合到一个统一的DataFrame中,然后利用Matplotlib的灵活性来绘制分组条形图。

1. 数据准备:聚合与合并

首先,我们需要对原始数据进行两次聚合,分别计算所需的指标(例如,总和和平均值),并将结果转换为普通的DataFrame,以便后续合并。reset_index()在此步骤中至关重要,它将多级索引转换为普通列,使得数据框可以基于这些列进行合并。

# 计算平均值并重置索引day_mean_dataframe = day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "mean"}).reset_index()# 计算总和并重置索引day_sum_dataframe = day_df.groupby(by=["yr", "season", "weathersit"]).agg({"cnt": "sum"}).reset_index()# 合并数据框# 使用 `on` 参数指定合并键,`suffixes` 参数处理同名列的后缀merged_df = pd.merge(day_mean_dataframe, day_sum_dataframe, on=["yr", "season", "weathersit"], suffixes=('_mean', '_sum'))print("合并后的数据框 (merged_df):")print(merged_df)

merged_df现在包含了每个分组的平均值(cnt_mean)和总和(cnt_sum),为后续的统一绘图奠定了基础。

2. 绘制分组条形图(垂直方向)

使用Matplotlib的plt.subplots创建图表和坐标轴对象,然后利用ax.bar函数绘制分组条形图。关键在于为不同指标的条形图设置不同的x轴位置偏移量,使其并排显示。

# 创建图表和坐标轴对象fig, ax = plt.subplots(figsize=(14, 7)) # 调整图表大小以适应更多标签# 计算每个分组的条形图的基准位置r1 = np.arange(len(merged_df))width = 0.35 # 条形图的宽度# 绘制平均值条形图ax.bar(r1 - width/2, merged_df["cnt_mean"], width=width, label='平均值', color='skyblue')# 绘制总和条形图,并向右偏移ax.bar(r1 + width/2, merged_df["cnt_sum"], width=width, label='总和', color='lightcoral')# 设置x轴刻度标签# 将多级分组键组合成一个字符串作为标签ax.set_xticks(r1)ax.set_xticklabels([f'年:{row.yr}, 季:{row.season}, 天气:{row.weathersit}' for _, row in merged_df.iterrows()], rotation=45, ha='right')# 添加图例和标题ax.legend()ax.set_xlabel('分组')ax.set_ylabel('计数')ax.set_title('各分组计数平均值与总和对比 (垂直条形图)')plt.tight_layout() # 调整布局以避免标签重叠plt.show()

3. 绘制分组条形图(水平方向)

对于分组标签较长或分组数量较多的情况,水平条形图(ax.barh)通常能提供更好的可读性。其原理与垂直条形图类似,只是交换了x轴和y轴的角色。

# 创建图表和坐标轴对象fig, ax = plt.subplots(figsize=(14, 8)) # 调整图表大小# 计算每个分组的条形图的基准位置r1 = np.arange(len(merged_df))height = 0.35 # 条形图的高度# 绘制平均值条形图ax.barh(r1 - height/2, merged_df["cnt_mean"], height=height, label='平均值', color='skyblue')# 绘制总和条形图,并向上偏移ax.barh(r1 + height/2, merged_df["cnt_sum"], height=height, label='总和', color='lightcoral')# 设置y轴刻度标签ax.set_yticks(r1)ax.set_yticklabels([f'年:{row.yr}, 季:{row.season}, 天气:{row.weathersit}' for _, row in merged_df.iterrows()])# 添加图例和标题ax.legend()ax.set_xlabel('计数')ax.set_ylabel('分组')ax.set_title('各分组计数平均值与总和对比 (水平条形图)')plt.tight_layout() # 调整布局plt.show()

注意事项与最佳实践

reset_index() 的重要性:在groupby().agg()之后,结果通常是一个多级索引的Series或DataFrame。reset_index()将其转换为普通的DataFrame,并将索引级别转换为常规列,这对于后续的pd.merge()操作至关重要。suffixes 参数:在pd.merge()中,如果两个DataFrame有同名的非合并列,suffixes参数可以为这些列添加不同的后缀,避免列名冲突,例如cnt_mean和cnt_sum。标签处理:当分组键包含多个维度时,如yr, season, weathersit,需要手动将它们组合成一个有意义的字符串作为刻度标签,以提高可读性。rotation和ha(horizontal alignment)参数可以帮助调整长标签的显示。图表尺寸与布局:使用figsize调整图表大小,特别是当分组数量较多或标签较长时。plt.tight_layout()可以自动调整子图参数,使之填充整个图表区域,避免标签重叠。颜色和图例:合理使用颜色区分不同的指标,并添加清晰的图例,有助于读者理解图表内容。选择条形图方向垂直条形图 (ax.bar) 适用于分组数量较少、分组标签较短的情况。水平条形图 (ax.barh) 适用于分组数量较多、分组标签较长的情况,可以有效避免标签重叠,提高可读性。

总结

通过将Pandas的groupby聚合结果与pd.merge相结合,我们能够有效地整合来自不同聚合操作的数据。随后,利用Matplotlib提供的强大绘图功能,我们可以灵活地创建分组条形图,无论是垂直还是水平方向,都能清晰地展示多指标在同一分组下的对比情况。这种方法不仅解决了直接链式绘图的局限性,也为更复杂的数据可视化提供了坚实的基础。

以上就是合并Pandas groupby聚合结果并进行分组条形图可视化的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1375755.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
优化Python矩阵运算:提升与Matlab媲美的性能
上一篇 2025年12月14日 15:17:55
Python列表推导式中的外部变量修改限制与高效计数方法
下一篇 2025年12月14日 15:18:10

相关推荐

  • Matplotlib 地图中多类型图例的创建与优化

    Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化

    本教程旨在解决matplotlib地图可视化中,如何在一个图例中同时展示颜色块(如区域分类)和自定义标记(如特定兴趣点)的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时,如何利用`matplotlib.lines.line2d`创建标记图例句柄,并将其与颜色块图例句柄合并,从而生成一…

    2026年5月10日 用户投稿
    900
  • 使用 Jupyter Notebook 进行探索性数据分析

    Jupyter Notebook通过单元格实现代码与Markdown结合,支持数据导入(pandas)、清洗(fillna)、探索(matplotlib/seaborn可视化)、统计分析(describe/corr)和特征工程,便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

    2026年5月10日
    000
  • HTML结构错误解析与W3C验证器指南

    本文旨在深入解析常见的html结构错误,特别是涉及` `、“和` `元素的不当使用,这些错误常导致w3c验证器报错。我们将详细阐述这些元素的正确语义和放置规则,解释隐式闭合机制如何引发验证问题,并通过实际代码示例展示如何构建符合标准、易于维护的html文档,从而提升网页的兼容性和可访问性…

    2026年5月10日
    000
  • SVG动态图形:实现路径与圆形元素的振动效果

    本教程详细介绍了如何利用SVG的SMIL动画功能,为线条和圆形元素创建生动的振动或摆动效果。我们将学习如何将直线转换为可动画的路径,并同步动画圆形元素的位置,以及如何将图像嵌入到动态圆形中,为您的SVG图形注入生命力,使其不再是静态的图像。 在svg中,为图形元素添加动态效果是提升用户体验和视觉吸引…

    2026年5月10日
    000
  • Chart.js多轴混合图表实现指南:结合柱状图与折线图并正确配置轴标签

    本文详细介绍了如何使用chart.js创建包含柱状图和折线图的多轴混合图表。重点阐述了数据结构定义、自定义背景图案函数以及chart.js scales配置项的正确使用,特别是如何为不同数据集分配独立的y轴,并确保轴标签的正确显示和定位,从而解决多轴图表配置中的常见问题。 在数据可视化中,我们经常需…

    2026年5月10日
    000
  • HTML5Canvas怎么画图_HTML5Canvas元素绘制图形的基本方法与实例

    Canvas通过JavaScript绘制图形,需先创建画布并获取2D上下文;使用fillRect、strokeRect绘矩形,arc绘圆,lineTo连线,结合fillStyle等设样式;示例绘制了黄色笑脸,包含眼嘴,体现其在图形与动画中的灵活性。 HTML5 中的 Canvas 元素提供了一个通过…

    2026年5月10日
    000
  • 如何将一组数值规范化到0-1范围:基于最大值的权重计算

    本教程详细介绍了如何将一组数值规范化到0-1的范围,其中最小值映射到0(或接近0),最大值映射到1。通过将每个数值除以集合中的最大值来实现,这在需要根据相对大小而非总和百分比来表示数据(如css透明度)时非常有用。 引言:理解数值规范化需求 在数据处理和前端开发中,我们经常需要将一组原始数值转换到一…

    2026年5月10日
    000
  • 如何用Python进行数据可视化(Matplotlib/Seaborn)?

    在Python中进行数据可视化,Matplotlib和Seaborn无疑是两大基石。简单来说,Matplotlib提供了绘图的底层控制和高度的定制化能力,就像一个万能的画板和各种画笔;而Seaborn则在此基础上进行了封装和优化,尤其擅长统计图表,它像一位经验丰富的艺术家,能用更少的指令绘制出美观且…

    2026年5月10日
    000
  • 使用Jinja2与Python动态加载并显示多张图片到HTML

    使用Jinja2与Python动态加载并显示多张图片到HTML使用Jinja2与Python动态加载并显示多张图片到HTML使用Jinja2与Python动态加载并显示多张图片到HTML使用Jinja2与Python动态加载并显示多张图片到HTML

    本文详细介绍了如何利用Jinja2模板引擎与Python后端,高效地将多张图片动态加载并渲染到HTML页面中。核心方法在于将图片数据组织成一个包含字典的列表,其中每个字典代表一张图片及其属性(如标题和文件路径),并通过Jinja2的`for`循环在HTML模板中迭代渲染,从而实现灵活且可维护的多图片…

    2026年5月10日 用户投稿
    100
  • 在数据可视化中,如何利用 D3.js 进行复杂的数据绑定和 DOM 操作?

    D3.js的核心优势在于数据绑定与DOM操作的精细控制,通过enter、update、exit模式实现数据驱动的动态更新;利用data join机制将数据与元素关联,支持嵌套绑定、分组操作及过渡动画,并通过key函数和选择集复用提升性能,从而构建高效响应式可视化。 在数据可视化中,D3.js 的核心…

    2026年5月10日
    000
  • 如何构建一个高性能的、基于Canvas的JavaScript数据可视化组件?

    答案:通过按需渲染、减少上下文操作和高效交互检测实现高性能Canvas可视化。使用isDirty标记控制重绘,合并路径绘制,预存静态图层,结合devicePixelRatio适配高清屏,利用空间索引与节流优化交互响应,避免全量刷新,提升性能。 构建一个高性能的基于 Canvas 的 JavaScri…

    2026年5月10日
    100
  • html5 圆形怎么画_HTML5用border-radius:50%或SVG circle画正圆【绘制】

    HTML5提供三种原生绘制正圆方法:一、CSS border-radius:50%适用于等宽高div;二、SVG circle元素通过cx/cy/r精确定义矢量圆;三、Canvas arc()方法用JavaScript像素级绘制动态圆。 如果您希望在网页中绘制一个完美的正圆形,HTML5 提供了多种…

    2025年12月23日
    900
  • Flexbox中实现首元素左对齐,其余元素右对齐的高效方法

    本教程将深入探讨在flexbox布局中,如何不使用额外包装器,仅通过巧妙运用css的`margin-left: auto`属性,实现将首个元素固定在容器左侧,而将其余所有兄弟元素推向右侧的布局技巧。通过具体代码示例和原理分析,帮助开发者高效解决常见的导航栏或列表元素分离对齐问题。 在构建现代网页布局…

    2025年12月23日
    000
  • 根据文本内容动态设置元素背景色的JavaScript教程

    本教程旨在详细讲解如何使用javascript动态地根据html元素(如`div`标签)的文本内容来改变其背景颜色。文章将通过具体的代码示例,展示如何获取特定类的所有元素、遍历它们,并根据其内部文本值应用不同的样式,最终实现在页面加载时自动执行此功能,从而提升网页的交互性和信息展示能力。 概述 在网…

    2025年12月23日
    000
  • Flexbox布局中实现首元素左对齐与其余元素右对齐的技巧

    本文详细介绍了在css flexbox布局中,如何不依赖额外包装元素,仅通过一行css代码实现首个子元素左对齐,而其余所有子元素自动向右对齐的效果。核心技巧在于利用`margin-left: auto;`属性,巧妙地分配flex容器中的剩余空间,从而实现元素的左右分离对齐,优化布局结构。 在现代网页…

    2025年12月23日
    000
  • SVG描边锥形渐变实现指南:利用CSS与SVG遮罩技术

    本文详细探讨了在svg元素描边上实现锥形渐变效果的方法。鉴于svg原生渐变(线性或径向)难以直接创建真锥形渐变,教程重点介绍了一种结合css `conic-gradient`和svg “的创新技术。通过将css锥形渐变作为svg背景,并利用svg遮罩精确控制渐变仅在描边区域显示,从而实现…

    2025年12月23日
    000
  • Flexbox布局中实现首元素左对齐与其余元素右对齐

    本文将详细介绍在flexbox布局中,如何不使用额外的包装器,仅通过css实现首个子元素左对齐,而其余子元素右对齐的布局效果。核心技巧在于利用`margin-left: auto;`将第二个元素及其后续兄弟元素推向容器的右侧,从而实现灵活且高效的两端对齐布局。 引言:Flexbox布局中的两端对齐挑…

    2025年12月23日
    000
  • Chart.js v3:程序化动态修改Y轴标签的实用指南

    本文详细介绍了在chart.js v3中如何通过编程方式动态修改图表y轴的标签文本。核心在于正确访问chart实例的配置对象路径`mychart.options.scales.y.title.text`,并确保标签的`display`属性设置为`true`,最后通过调用`mychart.update…

    2025年12月23日
    100
  • Chart.js v3 动态修改 Y 轴标题的专业指南

    本教程详细阐述了在 chart.js v3 中动态修改 y 轴标题的正确方法。通过访问 `mychart.options.scales.y.title.text` 属性并确保 `title.display` 为 `true`,开发者可以轻松更新轴标签。文章将提供清晰的代码示例,并强调 `mychar…

    2025年12月23日
    000
  • Chart.js v3:程序化动态修改Y轴标题的实用指南

    本教程详细介绍了在chart.js v3中如何程序化地动态修改图表y轴的标题。文章将指出常见的错误方法,并提供正确的api路径`mychart.options.scales.y.title.text`,强调确保标题显示 (`display: true`) 和调用 `mychart.update()`…

    2025年12月23日
    100

发表回复

登录后才能评论
关注微信