Pandas中获取同期季度/年度数据的专业指南

程序猿 • 2025年11月10日 12:43:58 • 用户投稿 • 阅读 1

本文详细介绍了如何在pandas dataframe中高效地计算同期季度（yoq）或同期月份（mom）数据。通过将季度字符串转换为pandas `periodindex`，并巧妙利用其时间偏移特性，结合dataframe的 `merge` 操作，可以精确地将当前季度的数值与前一年同期的数值进行匹配，从而实现复杂的时序数据对比分析。

在进行时序数据分析时，我们经常需要将当前报告期的数值与前一年同期（Year-over-Quarter, YoQ）或前一月同期（Month-over-Month, MoM）的数值进行比较。例如，将2021年第一季度的数据与2020年第一季度的数据进行对比。直接使用 shift() 函数通常只能实现相邻时间段的比较，而无法满足跨年同期的需求。本教程将介绍一种基于Pandas PeriodIndex 和 merge 操作的专业方法来解决这一问题。

数据准备与问题阐述

首先，我们构建一个包含季度数值的示例DataFrame：

import pandas as pddf = pd.DataFrame({'item':['A','A','A','A','A','A','B','B','B','B','B','B','C','C','C','C','C','C'],                  'quarter':['FY20_Q1','FY20_Q2','FY20_Q3','FY20_Q4','FY21_Q1','FY21_Q2',                         'FY20_Q1','FY20_Q2','FY20_Q3','FY20_Q4','FY21_Q1','FY21_Q2',                         'FY20_Q1','FY20_Q2','FY20_Q3','FY20_Q4','FY21_Q1','FY21_Q2'],                  'value':[100,150,120,135,128,160,230,210,240,220,250,230,125,230,162,111,134,135]})

如果尝试使用 groupby 和 shift 来获取前一年的同期值，会遇到问题。例如，以下代码会获取前一个季度的值，而非前一年的同期季度值：

df['value_prev_incorrect'] = df.sort_values(by=['item','quarter']).groupby(['item'])['value'].shift()print(df)

输出结果如下所示，value_prev_incorrect 列显示的是前一个季度的值，而不是前一年同期的值：

   item  quarter  value  value_prev_incorrect0     A  FY20_Q1    100                   NaN1     A  FY20_Q2    150                 100.02     A  FY20_Q3    120                 150.03     A  FY20_Q4    135                 120.04     A  FY21_Q1    128                 135.05     A  FY21_Q2    160                 128.0...

我们期望的结果是，例如 FY21_Q1 的 value_prev 应该对应 FY20_Q1 的值。

   item  quarter  value  value_prev (期望结果)0     A  FY20_Q1    100                  NaN1     A  FY20_Q2    150                  NaN2     A  FY20_Q3    120                  NaN3     A  FY20_Q4    135                  NaN4     A  FY21_Q1    128                100.05     A  FY21_Q2    160                150.0...

解决方案：使用 PeriodIndex 和合并操作

要实现精确的同期比较，核心思路是：

将表示季度或月份的字符串转换为Pandas PeriodIndex 对象，以便进行标准的时间偏移操作。为每个当前时间点计算出其前一年同期的时间点。通过 merge 操作将原始数据与自身进行合并，利用计算出的时间点进行匹配。

步骤1：标准化季度数据并创建 PeriodIndex

首先，我们需要将 quarter 列的字符串格式（如 FY20_Q1）转换为Pandas能够识别的周期对象。这里我们将其转换为 YYYY-QX 格式，然后创建 PeriodIndex。

# 将 "FYXX_QX" 格式转换为 "20XX-QX"df["current_period"] = df["quarter"].str.replace(r"FY(d+)_Q(d+)", r"201-Q2", regex=True)# 将字符串转换为 PeriodIndex，频率为季度 (Q)df["current_period"] = pd.PeriodIndex(df["current_period"], freq="Q")

现在 df 中新增了一列 current_period，其数据类型为 Period。

百度文心百中

百度大模型语义搜索体验中心

22 查看详情

步骤2：创建前一年同期标识

为了进行合并，我们需要为每个当前季度找到其前一年同期的标识。由于 PeriodIndex 支持时间偏移，我们可以直接利用它。对于季度数据，一年有4个季度，所以前一年同期可以通过减去4个季度来实现。

# 创建一个表示“前一年同期”的PeriodIndex列。# 注意：这里我们创建的是“当前季度 + 4个季度”的标识，# 这样在后续合并时，左侧的“当前季度”就能匹配右侧的“前一年同期”数据。# 具体来说，如果当前行是2021-Q1，那么`next_period`就是2022-Q1。# 在合并时，我们用左侧的`current_period`（例如2021-Q1）去匹配右侧的`next_period`。# 这样，当左侧的`current_period`是2021-Q1时，它会去寻找右侧`next_period`为2021-Q1的行。# 而右侧`next_period`为2021-Q1的行，其`current_period`实际上是2020-Q1。# 从而实现了2021-Q1匹配到2020-Q1的数据。df["next_period"] = df["current_period"] + 4

步骤3：执行合并操作

现在，我们可以将DataFrame与自身进行左连接（left merge）。左侧DataFrame使用 item 和 current_period 作为连接键，右侧DataFrame使用 item 和 next_period 作为连接键。这样，左侧的 current_period (例如 2021-Q1) 就会与右侧的 next_period (例如 2021-Q1) 进行匹配，而右侧 next_period 为 2021-Q1 的行，其 current_period 实际上是 2020-Q1，从而成功获取了前一年同期的数据。

out = df.merge(    df,    how="left",    left_on=["item", "current_period"], # 左侧DataFrame的当前季度    right_on=["item", "next_period"],   # 右侧DataFrame的“前一年同期”季度    suffixes=('_current', '_prev')       # 为区分同名列添加后缀)

步骤4：结果整理与展示

最后，选择并重命名所需的列，以获得清晰的输出结果。

final_df = out[["item", "quarter_current", "value_current", "value_prev"]].rename(    columns={"quarter_current": "quarter", "value_current": "value", "value_prev": "value_prev"})print(final_df)

完整的代码和输出如下：

import pandas as pddf = pd.DataFrame({'item':['A','A','A','A','A','A','B','B','B','B','B','B','C','C','C','C','C','C'],                  'quarter':['FY20_Q1','FY20_Q2','FY20_Q3','FY20_Q4','FY21_Q1','FY21_Q2',                         'FY20_Q1','FY20_Q2','FY20_Q3','FY20_Q4','FY21_Q1','FY21_Q2',                         'FY20_Q1','FY20_Q2','FY20_Q3','FY20_Q4','FY21_Q1','FY21_Q2'],                  'value':[100,150,120,135,128,160,230,210,240,220,250,230,125,230,162,111,134,135]})# 步骤1：标准化季度数据并创建 PeriodIndexdf["current_period"] = df["quarter"].str.replace(r"FY(d+)_Q(d+)", r"201-Q2", regex=True)df["current_period"] = pd.PeriodIndex(df["current_period"], freq="Q")# 步骤2：创建前一年同期标识# 这里创建的是“当前季度 + 4个季度”的标识，用于后续合并df["next_period"] = df["current_period"] + 4# 步骤3：执行合并操作# 左侧的 current_period (例如 2021-Q1) 会匹配右侧的 next_period (例如 2021-Q1)# 这样右侧的实际 current_period (2020-Q1) 的 value 就会被拉过来out = df.merge(    df,    how="left",    left_on=["item", "current_period"],    right_on=["item", "next_period"],    suffixes=('_current', '_prev'))# 步骤4：结果整理与展示final_df = out[["item", "quarter_current", "value_current", "value_prev"]].rename(    columns={"quarter_current": "quarter", "value_current": "value", "value_prev": "value_prev"})print(final_df)

输出结果：

   item  quarter  value  value_prev0     A  FY20_Q1    100         NaN1     A  FY20_Q2    150         NaN2     A  FY20_Q3    120         NaN3     A  FY20_Q4    135         NaN4     A  FY21_Q1    128       100.05     A  FY21_Q2    160       150.06     B  FY20_Q1    230         NaN7     B  FY20_Q2    210         NaN8     B  FY20_Q3    240         NaN9     B  FY20_Q4    220         NaN10    B  FY21_Q1    250       230.011    B  FY21_Q2    230       210.012    C  FY20_Q1    125         NaN13    C  FY20_Q2    230         NaN14    C  FY20_Q3    162         NaN15    C  FY20_Q4    111         NaN16    C  FY21_Q1    134       125.017    C  FY21_Q2    135       230.0

可以看到，value_prev 列现在包含了前一年同期的数据，例如 FY21_Q1 的 value_prev 是 100.0，对应 FY20_Q1 的值。

注意事项与最佳实践

数据类型转换的重要性： 将季度/月份字符串转换为 PeriodIndex 是此方法的关键。PeriodIndex 提供了强大的时间偏移功能，使得计算前一年同期变得简单而准确。freq 参数的设定： 在创建 PeriodIndex 时，务必根据数据的实际频率（如 Q 代表季度，M 代表月份）设置 freq 参数。这将直接影响时间偏移的准确性。合并键的选取： 除了时间周期外，通常还需要一个业务维度（如 item）作为合并键，以确保不同业务实体之间的数据不会混淆。处理缺失值： 对于数据集中最早的年份，其同期数据将不存在，因此 value_prev 列会显示 NaN。这是预期行为，表示没有可供比较的前一年同期数据。灵活性： 这种方法不仅适用于季度数据，也适用于月份数据（只需将 freq=”Q” 改为 freq=”M”，并将偏移量 +4 改为 +12）。性能考量： 对于非常大的数据集，merge 操作通常是高效的。但在极端情况下，如果内存成为瓶颈，可能需要考虑其他优化策略，例如先设置 PeriodIndex 为DataFrame索引，然后使用 reindex 或自定义函数。

总结

通过将原始的季度或月份字符串数据转换为 PeriodIndex，并结合Pandas强大的 merge 操作，我们可以精确且高效地获取前一年同期的数据。这种方法避免了 shift() 函数在跨年同期比较时的局限性，为时序数据分析提供了坚实的基础。掌握这一技巧，将使您在处理复杂的时序比较任务时更加得心应手。

以上就是Pandas中获取同期季度/年度数据的专业指南的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/584833.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

消息称 OPPO Find N5 折叠屏手机对应海外版本一加 OPEN 2 将于明年第二季度后全球推出

上一篇 2025年11月10日 12:43:55

VSCode文件比较和合并功能

下一篇 2025年11月10日 12:44:00

用户投稿

获取日期中的周数：CodeIgniter 教程

本教程旨在帮助开发者在 CodeIgniter 框架中，从日期字符串中准确提取周数。我们将使用 PHP 内置的 DateTime 类，并提供详细的代码示例和注意事项，确保您能够轻松地在项目中实现此功能。使用 DateTime 类获取周数 PHP 的 DateTime 类提供了一种便捷的方式来处理日…

程序猿
2026年5月10日
1000
用户投稿

SQL查询：精确判断事件过期，结合日期与时间列

本文旨在解决数据库中事件过期判断不精确的问题，特别是当事件的过期日期和时间分别存储在不同列时。我们将探讨两种主流的sql查询策略：一种是利用逻辑运算符`or`和`and`进行分情况判断，另一种是通过合并日期和时间列为单一时间戳进行直接比较。文章将详细阐述每种方法的实现方式、适用场景及相关注意事项，确…

程序猿
2026年5月10日
1000
用户投稿

Pandas DataFrame月度数据按季度和年度汇总教程

本教程旨在指导用户如何利用Pandas库将包含YYYYMM格式月度数据的宽格式DataFrame，高效地转换为季度和年度汇总数据。文章将详细介绍如何通过melt操作重塑数据、提取时间维度信息，并运用groupby和映射机制实现灵活的季度与年度聚合，最终生成结构清晰的汇总结果。 1. 引言：问题背景与…

程序猿
2026年5月10日
0000
用户投稿

使用JavaScript生成高级vCard：集成图片与多字段数据

本文详细阐述如何利用JavaScript增强vCard的生成功能，重点聚焦于添加联系人照片及诸如公司、职位、地址等多样化详细信息。通过深入解析vCard标准及其属性，文章提供了实用的代码示例，指导开发者创建功能更全面、内容更丰富的数字名片，从而提升用户保存联系方式的体验。理解vCard标准与核心属…

程序猿
2026年5月10日
0000
用户投稿

HTML注释怎么实现时间戳记录_使用注释标注代码更新时间

答案：HTML注释时间戳可用于追踪代码修改历史、协助团队协作、定位问题和提醒维护；通过编辑器插件或构建工具自动化生成；应遵循ISO 8601格式、保持简洁并定期清理；但存在易被篡改、缺乏版本控制、增加文件体积等局限，需结合Git等系统使用。使用HTML注释来记录时间戳，核心在于利用注释标签，并在…

程序猿
2026年5月10日
1000
用户投稿

Golang time库时间处理与格式化示例

Go语言中时间处理的核心是time.Time类型和“参考时间”Mon Jan 2 15:04:05 MST 2006，用于格式化和解析；通过time.Now()获取当前时间，Parse()和Format()进行字符串与时间的转换，Add()和Sub()实现时间加减，Before()、After()、…

程序猿
2026年5月10日
0000
C++怎样实现简易记账本类封装与收支记录管理

记账本适合用c++++练习类封装与数据管理，核心在于将收支记录抽象为类并合理组织代码结构。1. 设计incomeexpense类表示单条记录，包含金额、类型、日期、分类和备注，并提供访问和显示方法；2. ledger类管理所有记录，支持添加、显示全部、按分类筛选及统计总收入与支出；3. 主程序提供菜…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

LangChain表达式语言：多链间变量传递与状态管理

本文深入探讨了LangChain表达式语言中跨链变量传递与状态管理的挑战与解决方案。当构建复杂的LLM应用时，常需将原始输入变量与前一链的输出结果一同传递给后续链。文章通过具体代码示例，详细阐述了如何利用operator.itemgetter高效、明确地实现这一目标，确保原始上下文信息在多链流程中得…

程序猿
2026年5月10日
0000
用户投稿

Python字典数据结构优化与值提取实践

本文旨在探讨Python中字典数据结构的常见误用，并提供优化方案，特别是在需要提取字典值进行进一步处理（如排序）时。通过一个生日管理应用的具体案例，我们将演示如何正确构建字典，从而简化值的访问和操作，避免因不当结构导致的困扰，并提升代码的可读性和效率。 1. 理解Python字典及其核心用途 Pyt…

程序猿
2026年5月10日
0000
用户投稿

Playwright：Web UI 自动化测试框架全面概述

playwright是微软开发的web ui自动化测试框架。它旨在提供一个跨平台、跨语言、跨浏览器的自动化测试框架，同时也支持移动浏览器。如其官方主页所述：自动等待、页面元素智能断言、执行追踪等功能，在处理网页不稳定方面非常有效。它在与运行测试的进程不同的进程中控制浏览器，消除了进程内测试运行…

程序猿
2026年5月10日
0000
用户投稿

在 JavaScript 中移动 TodoList 中的“正在进行”任务如何解决？

javascript 中使用 dom 更新 todolist 在您的问题中，您遇到了在使用 javascript 通过 dom 更新 todolist 时遇到困难的问题。具体来说，您无法将“正在进行”的任务移动到“已完成”部分。问题原因在您提供的 javascript 代码中，拼写错误导致“正在…

程序猿
2025年12月24日
0000
用户投稿

在使用 JavaScript 实现的 TodoList 中，如何正确判断 Checkbox 点击事件，从而归类任务？

使用 javascript 实现 todolist，点击 checkbox 后无法正确归类任务问题描述：在使用 javascript 实现的 todolist 中，点击“正在进行”任务中的 checkbox，无法将任务自动归类到“已完成”任务列表。原因分析：在提供的代码中，发现有一个单词拼写错误…

程序猿
2025年12月24日
4000
用户投稿

html5怎么设置月份_HTML5用input type=”month”让用户选择年月月份【设置】

HTML5的input type=”month”提供原生年月选择器，格式为“YYYY-MM”，支持value默认值、min/max范围限制、name表单提交，并需JavaScript降级兼容旧浏览器。如果您希望在网页中提供一个简洁的年月选择控件，HTML5 的 input …

程序猿
2025年12月23日
12000
用户投稿

jimdo怎么插入html5时间轴_jimdo时间轴html5代码与节点样式【实操】

Jimdo网站需用自定义HTML5代码实现时间轴：一、内联HTML+CSS轻量嵌入；二、外链CSS+语义化HTML便于复用；三、调用timeline-js-lite库支持交互；四、纯CSS方案零依赖高性能。如果您希望在 Jimdo 网站中呈现可视化的时间发展脉络，但默认编辑器不支持原生时间轴组件，…

程序猿
2025年12月23日
5000
用户投稿

html5怎么调日期_HTML5用input type=”date”让用户选择或JS调日期【调整】

HTML5原生input type=”date”提供日期选择功能，支持min/max/value属性限制范围，JavaScript可设置/读取YYYY-MM-DD格式值，showPicker()可尝试唤起选择器，不支持时降级为带pattern验证的文本输入。如果您希望在网页…

程序猿
2025年12月23日
0000
用户投稿

html5怎么设置时间_HTML5用input type=”time”或JS Date对象设时间【设置】

HTML5通过input type=”time”实现原生时间输入，支持min/max限制和value预设；JavaScript用Date对象获取当前时间、格式化为HH:MM并赋值，或构造/设置指定时间后写入表单。如果您需要在网页中设置时间输入或动态获取当前时间，HTML5 …

程序猿
2025年12月23日
3000
用户投稿

html5表白页面制作_创意动画与交互式表白设计【教程】

可打造独特HTML5表白页：一、CSS3爱心跳动动画；二、JS鼠标跟随花瓣飘落；三、Canvas点击烟花爆炸；四、Web Speech语音+打字机文字；五、双击3D翻转照片墙。如果您希望为心爱的人打造一个独特而富有情感的HTML5表白页面，可以通过创意动画与交互式设计来增强视觉吸引力和参与感。以下…

程序猿
2025年12月23日
0000
用户投稿

html如何输入年月日_在HTML表单中输入年月日格式【格式】

推荐使用原生input type=”date”，语义清晰且自动验证；兼容性不足时可用三select下拉框（完全可控）或text+pattern（自由输入）；需高级功能则选Flatpickr等插件。如果您希望在HTML表单中让用户输入年月日格式的日期，需根据兼容性、语义化与用…

程序猿
2025年12月23日
2000
用户投稿

如何限制HTML日期输入框在特定时间范围内

本教程详细介绍了如何在html的`input[type=”date”]`元素中限制用户选择日期的范围，特别是将其限制在未来特定天数内。文章将通过原生html和javascript计算`max`属性值的方法，实现仅允许选择未来14天内的日期。同时，也会提及在更复杂场景下使用第三…

程序猿
2025年12月23日
1000
用户投稿

限制HTML日期输入框选择范围：实现未来两周日期限制

本教程将详细介绍如何使用html5的`input[type=’date’]`元素，并通过动态计算`max`属性来限制用户只能选择未来特定时间范围（例如未来两周）内的日期。我们将提供javascript代码示例，并解析其实现原理，确保日期输入框符合业务逻辑要求，提升用户体验和数…

程序猿
2025年12月23日
0000