Pandas数据透视：将月度数据汇总为季度和年度列

程序猿 • 2025年12月14日 13:01:13 • 用户投稿 • 阅读 0

本教程详细介绍了如何使用Pandas高效地将DataFrame中按YYYYMM格式存储的月度数据汇总为季度和年度数据。通过数据重塑（melt）、字符串操作提取日期信息、自定义映射和分组聚合（groupby），最终将汇总结果以宽格式（新列）呈现，避免了手动硬编码列名的繁琐。

在数据分析场景中，我们经常会遇到需要将细粒度的时间序列数据（如月度数据）聚合到更粗粒度的周期（如季度或年度）的需求。当这些月度数据以列的形式存储在pandas dataframe中时，传统的逐列求和方法会非常低效且难以维护。本教程将提供一个通用且灵活的解决方案，利用pandas的强大功能自动化这一过程。

1. 问题描述与原始数据结构

假设我们有一个Pandas DataFrame，其中包含按YYYYMM格式命名的列，每列代表一个特定月份的数值数据。DataFrame的索引通常是某种标识符（例如，产品ID、区域代码等）。

原始DataFrame示例：

   201003  201004  201005  201006  201007  201008IDA      10      11      14      22      10      19B      14      19      20      22      26      11

我们的目标是将这些月度数据汇总为季度和年度数据，并将结果作为新的列添加到DataFrame中（或生成新的汇总DataFrame），例如生成2010Q2、2010Q3、2010Annual等列。

2. 解决方案步骤

为了实现这一目标，我们将采用以下步骤：

2.1 导入必要的库并准备示例数据

首先，导入Pandas库并创建与问题描述相符的示例DataFrame。

import pandas as pd# 原始数据示例data = {    '201003': [10, 14],    '201004': [11, 19],    '201005': [14, 20],    '201006': [22, 22],    '201007': [10, 26],    '201008': [19, 11]}df_original = pd.DataFrame(data, index=['A', 'B'])# 确保索引有名称，便于后续melt操作df_original.index.name = 'ID'print("原始DataFrame:")print(df_original)

2.2 数据重塑：将列转换为行 (df.melt())

这是解决问题的关键一步。df.melt()函数可以将DataFrame从宽格式（多个数据列）转换为长格式（数据列被“融化”到行中）。这样，每个月度值都将成为一行，并且其对应的YYYYMM列名将作为新列中的值。

# 将月份列转换为行，同时保留ID列作为标识符df_melted = df_original.reset_index().melt(    id_vars='ID',          # 指定作为标识符的列    var_name='YYYYMM',     # 新的列名，用于存放原月份列名    value_name='Value'     # 新的列名，用于存放原月份列的值)print("n步骤2.2: 数据重塑后的DataFrame (部分):")print(df_melted.head())

说明：

df_original.reset_index(): 将原始DataFrame的索引（’ID’）转换为普通列，以便在melt操作中保留。id_vars=’ID’: 指定哪些列作为标识符列（不被融化）。var_name=’YYYYMM’: 指定新列的名称，该列将包含原始DataFrame中被融化的列名（即YYYYMM字符串）。value_name=’Value’: 指定新列的名称，该列将包含原始DataFrame中被融化的列的值。

2.3 提取年份和月份信息

在长格式DataFrame中，YYYYMM列包含了我们需要的所有日期信息。我们可以使用字符串切片来轻松提取年份和月份。

df_melted['Year'] = df_melted['YYYYMM'].str[:4]  # 提取前4位作为年份df_melted['Month'] = df_melted['YYYYMM'].str[4:] # 提取后2位作为月份print("n步骤2.3: 提取年份和月份后的DataFrame (部分):")print(df_melted.head())

2.4 映射月份到季度

为了计算季度总和，我们需要将每个月份映射到其对应的季度。这可以通过创建一个字典映射并使用df.map()方法来实现。

month_quarter_map = {    '01': 1, '02': 1, '03': 1,    '04': 2, '05': 2, '06': 2,    '07': 3, '08': 3, '09': 3,    '10': 4, '11': 4, '12': 4}df_melted['Quarter'] = df_melted['Month'].map(month_quarter_map)print("n步骤2.4: 映射月份到季度后的DataFrame (部分):")print(df_melted.head())

2.5 计算季度和年度总和

现在，数据已经准备好进行聚合。我们可以使用groupby()方法按ID、Year和Quarter（或仅Year）进行分组，然后对Value列求和。

# 计算季度总和：按ID、年份和季度分组，并对'Value'列求和quarterly_sums = df_melted.groupby(['ID', 'Year', 'Quarter'])['Value'].sum().reset_index()print("n步骤2.5: 季度总和结果:")print(quarterly_sums)# 计算年度总和：按ID和年份分组，并对'Value'列求和annual_sums = df_melted.groupby(['ID', 'Year'])['Value'].sum().reset_index()print("n步骤2.5: 年度总和结果:")print(annual_sums)

2.6 将汇总结果重塑为宽格式列

为了将季度和年度总和作为新的列添加到DataFrame中，我们可以使用pivot_table()或unstack()方法将长格式的聚合结果转换回宽格式。

# 季度总和宽格式quarterly_wide = quarterly_sums.pivot_table(    index='ID',    columns=['Year', 'Quarter'],    values='Value').fillna(0) # 填充可能缺失的季度数据，例如某些ID在特定季度没有数据# 优化列名，使其更具可读性，例如 '2010Q1'quarterly_wide.columns = [f"{year}Q{quarter}" for year, quarter in quarterly_wide.columns]print("n步骤2.6: 季度总和 (宽格式

以上就是Pandas数据透视：将月度数据汇总为季度和年度列的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1373175.html

yy 编码

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Statsmodels 回归模型：如何进行准确的单值预测

上一篇 2025年12月14日 13:01:05

使用Parsimonious构建鲁棒的CSV风格字符串解析器

下一篇 2025年12月14日 13:01:19

好文分享

在 JavaScript 中移动 TodoList 中的“正在进行”任务如何解决？

javascript 中使用 dom 更新 todolist 在您的问题中，您遇到了在使用 javascript 通过 dom 更新 todolist 时遇到困难的问题。具体来说，您无法将“正在进行”的任务移动到“已完成”部分。问题原因在您提供的 javascript 代码中，拼写错误导致“正在…

程序猿
2025年12月24日
0000
好文分享

在使用 JavaScript 实现的 TodoList 中，如何正确判断 Checkbox 点击事件，从而归类任务？

使用 javascript 实现 todolist，点击 checkbox 后无法正确归类任务问题描述：在使用 javascript 实现的 todolist 中，点击“正在进行”任务中的 checkbox，无法将任务自动归类到“已完成”任务列表。原因分析：在提供的代码中，发现有一个单词拼写错误…

程序猿
2025年12月24日
4000
好文分享

css怎么设置文件编码

在css中，可以使用“@charset”规则来设置编码，语法格式“@charset “字符编码类型”;”。“@charset”规则可以指定样式表中使用的字符编码，它必须是样式表中的第一个元素，并且不能以任何字符开头。本教程操作环境：windows7系统、CSS3&&…

程序猿
2025年12月24日
0000
好文分享

响应式HTML5按钮适配不同屏幕方法【方法】

实现响应式HTML5按钮需五种方法：一、CSS媒体查询按max-width断点调整样式；二、用rem/vw等相对单位替代px；三、Flexbox控制容器与按钮伸缩；四、CSS变量配合requestAnimationFrame优化的JS动态适配；五、Tailwind等框架的响应式工具类。如果您希望H…

程序猿
2025年12月23日
1000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
4000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
html5怎么引用js_HTML5用外链或内嵌JS代码引用脚本【引用】

HTML5中执行JavaScript需通过外链或内嵌方式引入：一、外链用，支持defer/async；二、内嵌将代码写入间，推荐置于body底部；三、type属性默认可省略；四、模块化使用type=”module”支持ES6 import/export。 <img sr…

程序猿
好文分享 2025年12月23日
1000
好文分享

html5怎么设置月份_HTML5用input type=”month”让用户选择年月月份【设置】

HTML5的input type=”month”提供原生年月选择器，格式为“YYYY-MM”，支持value默认值、min/max范围限制、name表单提交，并需JavaScript降级兼容旧浏览器。如果您希望在网页中提供一个简洁的年月选择控件，HTML5 的 input …

程序猿
2025年12月23日
3000
好文分享

html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

首先检查文件扩展名和编码格式，确保为.html且使用UTF-8编码；接着验证HTML5结构完整性，包含及正确闭合的标签；然后排查外部资源路径是否正确，利用开发者工具查看404错误；排除浏览器兼容性问题，优先在现代浏览器中测试并避免未广泛支持的API；检查JavaScript语法错误与执行顺序，确保脚…

程序猿
2025年12月23日
1000
好文分享

html5怎么读取文件_html5用FileReader API读取本地文件内容或属性【读取】

HTML5的FileReader API支持读取本地文件内容及获取基本信息：一、通过input type=”file”获取File对象；二、用readAsText读取文本；三、用readAsDataURL生成Data URL预览资源；四、用readAsArrayBuffer读…

程序猿
2025年12月23日
1000
好文分享

jimdo怎么插入html5时间轴_jimdo时间轴html5代码与节点样式【实操】

Jimdo网站需用自定义HTML5代码实现时间轴：一、内联HTML+CSS轻量嵌入；二、外链CSS+语义化HTML便于复用；三、调用timeline-js-lite库支持交互；四、纯CSS方案零依赖高性能。如果您希望在 Jimdo 网站中呈现可视化的时间发展脉络，但默认编辑器不支持原生时间轴组件，…

程序猿
2025年12月23日
0000
好文分享

html5怎么写css_html5用style标签内嵌或外部css文件编写样式【编写】

可通过内嵌CSS、引入外部CSS文件或使用行内style属性为HTML5页面元素添加样式：一、用标签在中写CSS；二、用标签引用外部.css文件；三、在元素标签中直接写style属性。如果您希望在HTML5文档中为页面元素添加样式，则可以通过内嵌CSS或引入外部CSS文件来实现。以下是具体操作方法…

程序猿
2025年12月23日
0000
好文分享

html5怎么引入字体_HTML5用@font-face引入本地或网络字体文件【引入】

需用CSS的@font-face规则加载自定义字体，步骤包括：准备WOFF2/WOFF/TTF多格式文件并存放至项目目录；在CSS中为每种字重和样式单独声明@font-face；通过font-family应用字体；可选Google Fonts外链方式；添加font-display: swap缓解FO…

程序猿
2025年12月23日
1000
好文分享

html5怎么引用图标_html5用iconfont或img标签引用图标文件显示【引用】

HTML5图标显示异常可因路径错误、引用不当或字体未加载，解决方法包括：一、用iconfont类名引用；二、用Unicode字符引用；三、用img标签引用位图；四、内联SVG图标；五、预加载字体文件。如果您在HTML5页面中需要显示图标，但图标无法正常加载或显示效果不符合预期，则可能是由于图标文件…

程序猿
2025年12月23日
0000
好文分享

html5如何插入txt纯文本_html5txt文本嵌入与编码设置【实操】

可通过iframe、fetch+pre、object标签或服务端预处理四种方式在HTML5中显示外部TXT文件，需重点处理字符编码（如UTF-8声明、BOM、响应头）并防范XSS风险。如果您希望在HTML5页面中显示外部TXT纯文本文件的内容，浏览器默认不支持直接嵌入TXT文件为可渲染内容，必须通…

程序猿
2025年12月23日
0000
好文分享

怎么用html5链接_html5用a标签href属性给文字或图片加跳转链接【使用】

HTML5中使用a元素配合href属性实现跳转：可为文字、图片添加超链接；支持绝对URL、相对路径及页面内锚点；通过target=”_blank”和rel=”noopener”可在新标签页安全打开链接。如果您希望在网页中为文字或图片添加可点击的跳转功…

程序猿
2025年12月23日
4000
好文分享

如何运行html代码_html代码运行方法【步骤】

HTML代码需保存为.html文件并用浏览器打开才能正确显示；若含AJAX或外部资源则需本地服务器；临时测试可用开发者工具；在线编辑器支持即时预览。如果您编写了一段HTML代码，但无法在浏览器中正确显示效果，则可能是由于文件未以正确的格式保存或未通过浏览器打开。以下是运行HTML代码的具体步骤： …

程序猿
2025年12月23日
1000
好文分享

html5怎么全部加密_html5用JS混淆或webpack加密工具打包加密代码【加密】

可通过五种技术实现HTML5中JS混淆加密：一、javascript-obfuscator工具；二、Webpack+webpack-obfuscator插件；三、Terser插件高级配置；四、HTML内联Base64动态解密；五、服务端Node.js实时混淆注入。如果您希望对 HTML5 页面中的…

程序猿
2025年12月23日
0000
好文分享

html5怎么调日期_HTML5用input type=”date”让用户选择或JS调日期【调整】

HTML5原生input type=”date”提供日期选择功能，支持min/max/value属性限制范围，JavaScript可设置/读取YYYY-MM-DD格式值，showPicker()可尝试唤起选择器，不支持时降级为带pattern验证的文本输入。如果您希望在网页…

程序猿
2025年12月23日
0000
好文分享

html5音频怎么写_HT5用audio标签src引音频加controls播放【编写】

HTML5的标签可嵌入音频并提供播放控制：基础写法用src+controls；增强兼容性需嵌套多个带type的标签；提升可访问性应添加fallback文本及autoplay等布尔属性。如果您希望在网页中嵌入一段音频并提供播放控制功能，则可以使用 HTML5 的标签。以下是实现该功能的具体方法： …

程序猿
2025年12月23日
0000