使用 Pandas 进行 DataFrame 重塑:从长表到宽表

使用 pandas 进行 dataframe 重塑:从长表到宽表

本文旨在讲解如何使用 Pandas 库将 DataFrame 从长表(long format)重塑为宽表(wide format)。通过 pivot 和 stack 函数的组合使用,可以灵活地转换数据结构,满足不同的数据分析需求。本文将提供详细的代码示例和解释,帮助读者掌握这一关键的数据处理技巧。

DataFrame 重塑:从长表到宽表

在数据分析中,经常需要对 DataFrame 的结构进行调整,以便更好地进行数据分析和可视化。其中一种常见的操作就是将长表转换为宽表。长表通常包含多个重复的索引列,而宽表则将这些索引列转换为列名,使得数据更加紧凑和易于理解。

Pandas 提供了多种方法来实现 DataFrame 的重塑,本文将重点介绍使用 pivot 和 stack 函数的组合方法。

使用 pivot 和 stack 重塑 DataFrame

假设我们有以下 DataFrame:

import pandas as pddata = {'Date': [1, 1, 1],        'Item': [1, 2, 3],        'A': ['a1', 'a2', 'a3'],        'B': ['b1', 'b2', 'b3']}df = pd.DataFrame(data)print(df)

输出:

   Date  Item   A   B0     1     1  a1  b11     1     2  a2  b22     1     3  a3  b3

我们的目标是将其转换为以下宽表格式:

   Date Letter Item 1 Item 2 Item 30     1      A     a1     a2     a31     1      B     b1     b2     b3

可以使用以下代码实现:

out = (df.pivot(columns='Item', index='Date').stack(0)       .add_prefix('Item ').reset_index(names=['Date', 'Letter']))print(out)

输出:

   Date Letter Item 1 Item 2 Item 30     1      A     a1     a2     a31     1      B     b1     b2     b3

代码解释:

df.pivot(columns=’Item’, index=’Date’): pivot 函数用于将 “Item” 列的值转换为新的列名,并将 “Date” 列设置为索引。 原始的 “A” 和 “B” 列将作为新的列的值。.stack(0): stack(0) 函数将列索引 “A” 和 “B” 堆叠为行索引,形成一个多层索引的 Series。 0 代表堆叠第一层列索引。.add_prefix(‘Item ‘): add_prefix 函数为列名添加 “Item ” 前缀,使得列名更加清晰。.reset_index(names=[‘Date’, ‘Letter’]): reset_index 函数将索引重置为列,并将列名设置为 “Date” 和 “Letter”。

总结

通过 pivot 和 stack 函数的组合使用,可以方便地将 Pandas DataFrame 从长表重塑为宽表。这种方法灵活且易于理解,是数据分析中常用的数据处理技巧。 在实际应用中,可以根据具体的需求调整 pivot 和 stack 函数的参数,以达到最佳的重塑效果。

以上就是使用 Pandas 进行 DataFrame 重塑:从长表到宽表的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1370780.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 10:50:38
下一篇 2025年12月14日 10:50:46

相关推荐

发表回复

登录后才能评论
关注微信