Pandas DataFrame高级重塑：将多级列索引转换为行索引与合并列名

程序猿 • 2025年12月14日 20:15:29 • 用户投稿 • 阅读 1

本文详细介绍了如何使用Pandas库对DataFrame进行高级重塑操作。我们将一个具有多级列索引（如岛屿和年份）以及月份作为行索引的DataFrame，转换成以岛屿名称作为行索引，并以合并后的月份和年份（例如“JAN2022”）作为单级列索引的新结构。核心步骤包括利用stack()进行堆叠、transpose()进行转置，以及Index.map()来扁平化和自定义列名，从而实现数据的灵活布局。

在数据分析和报告生成中，我们经常需要根据特定的分析需求来重塑Pandas DataFrame的结构。本教程将展示一个常见的重塑场景：如何将一个具有多级列索引（MultiIndex columns）和单级行索引的DataFrame，转换为一个以原始DataFrame的某个列级别作为新的行索引，并将其余索引级别合并为新的单级列索引的DataFrame。

初始DataFrame结构

假设我们有一个DataFrame，其结构如下所示。它包含了不同岛屿（St Thomas, St. Croix）在不同年份（2022, 2023）的月度数据，月份作为行索引。

Island St Thomas         St. Croix        Year        2022    2023      2022    2023Month                                     JAN       55,086  60,470    11,550  12,755FEB       57,929  56,826    12,441  13,289MAR       72,103  64,249    14,094  15,880APR       67,469  56,321    12,196  13,092MAY       60,092  49,534    13,385  16,497JUN       67,026  56,950    14,009  15,728JUL       66,353  61,110    13,768  16,879AUG       50,660  42,745    10,673  12,102SEP       24,507  25,047     6,826   6,298OCT       34,025  34,462    10,351   9,398NOV       44,500     NaN     9,635     NaNDEC       58,735     NaN    12,661     NaN

我们的目标是将此DataFrame转换为一个具有两行（分别代表“St Thomas”和“St. Croix”）和24列（例如“JAN2022”、“FEB2022”等）的结构。

核心重塑操作

为了实现上述目标，我们将利用Pandas的stack()、transpose()（或其简写.T）以及Index.map()方法。

1. 使用 stack() 堆叠最内层列索引

DataFrame.stack()方法用于将DataFrame的“宽”格式转换为“长”格式。它将DataFrame的列（或指定级别）“堆叠”到行索引上，从而产生一个Series或一个具有MultiIndex行的新DataFrame。

在这个例子中，我们的列索引是(‘Island’, ‘Year’)的多级索引。默认情况下，stack()会堆叠最内层（即Year）的列索引。执行df.stack()后，Year级别将从列索引移动到行索引，与原有的Month索引形成一个MultiIndex行。

# 假设df是上面描述的初始DataFrame# df = ... (通过前置代码生成)# 堆叠最内层列索引 'Year'stacked_df = df.stack()print("--- After stack() ---")print(stacked_df)

此时，stacked_df的结构将是：

Island         St Thomas St. CroixMonth Year                        JAN   2022        55,086    11,550      2023        60,470    12,755FEB   2022        57,929    12,441      2023        56,826    13,289...DEC   2022        58,735    12,661

现在，Month和Year是行索引，而Island是列索引。

2. 使用 transpose() 转置DataFrame

DataFrame.transpose()（或简写.T）方法用于交换DataFrame的行和列。在我们的场景中，我们希望Island成为行索引，而Month和Year的组合成为列索引。

对stacked_df执行转置操作：

transposed_df = stacked_df.Tprint("n--- After transpose() ---")print(transposed_df)

转置后的transposed_df将具有以下结构：

Month     JAN            FEB            MAR       ... NOV     DEC    Year     2022    2023   2022    2023   2022    2023 ... 2022    2022   Island                                            ...                St Thomas  55,086  60,470  57,929  56,826  72,103  64,249 ...  44,500  58,735St. Croix  11,550  12,755  12,441  13,289  14,094  15,880 ...   9,635  12,661

现在，Island成为了行索引，而列索引是Month和Year组成的多级索引。这已经非常接近我们的目标了。

3. 使用 Index.map() 扁平化和自定义列名

最后一步是将多级列索引(‘Month’, ‘Year’)扁平化为单个字符串，例如“JAN2022”。我们可以通过Index.map()方法，结合一个lambda函数来实现这一点。

Index.map()允许我们对索引中的每个元素应用一个函数，并返回一个新的索引。对于一个MultiIndex，每个元素是一个元组（例如 (‘JAN’, ‘2022’)）。

# 扁平化列索引transposed_df.columns = transposed_df.columns.map(lambda x: f'{x[0]}{x[1]}')# 或者使用更简洁的方式# transposed_df.columns = map(''.join, transposed_df.columns)out = transposed_dfprint("n--- Final Output ---")print(out)

最终输出的DataFrame out 将符合我们的要求：

          JAN2022 JAN2023 FEB2022 FEB2023 MAR2022 MAR2023 APR2022 APR2023 MAY2022 MAY2023 JUN2022 JUN2023 JUL2022 JUL2023 AUG2022 AUG2023 SEP2022 SEP2023 OCT2022 OCT2023 NOV2022 DEC2022Island                                                                                                                                                                                   St Thomas  55,086  60,470  57,929  56,826  72,103  64,249  67,469  56,321  60,092  49,534  67,026  56,950  66,353  61,110  50,660  42,745  24,507  25,047  34,025  34,462  44,500  58,735St. Croix  11,550  12,755  12,441  13,289  14,094  15,880  12,196  13,092  13,385  16,497  14,009  15,728  13,768  16,879  10,673  12,102   6,826   6,298  10,351   9,398   9,635  12,661

完整代码示例

为了演示的完整性，下面提供了生成初始DataFrame并执行重塑操作的完整代码：

import pandas as pdimport tabula# --- 原始DataFrame的生成代码 (来自问题描述) ---page_number = "1"pdf_url = "https://usviber.org/wp-content/uploads/2023/12/A23-OCT.pdf"tables = tabula.read_pdf(pdf_url, pages=page_number)df = tables[1]numeric_columns = df.select_dtypes(include=["number"])df = df.drop(numeric_columns.columns[(numeric_columns < 0).any()], axis=1)df = df.loc[2:13, :].iloc[:, :5]df.set_index(df.columns[0], inplace=True)df.columns = pd.MultiIndex.from_product(    [["St Thomas", "St. Croix"], ["2022", "2023"]], names=["Island", "Year"])df.index = df.index.map(lambda x: str(x).upper()[:3])df.index.set_names("Month", inplace=True)print("--- Initial DataFrame ---")print(df)# --- 重塑操作 ---# 1. 堆叠最内层列索引 'Year'stacked_df = df.stack()# 2. 转置DataFrame，使'Island'成为行索引transposed_df = stacked_df.T# 3. 扁平化多级列索引，合并'Month'和'Year'transposed_df.columns = transposed_df.columns.map(lambda x: f'{x[0]}{x[1]}')# 最终结果out = transposed_dfprint("n--- Final Reshaped DataFrame ---")print(out)

注意事项与总结

stack() 的层级控制：stack() 默认会堆叠最内层的列索引。如果需要堆叠特定层级的列索引，可以使用 stack(level=…) 参数。unstack() 的反向操作：unstack() 是 stack() 的逆操作，它将行索引的某个级别转换为列索引。处理 NaN 值：在重塑过程中，如果原始数据包含 NaN 值，这些 NaN 值会保留在重塑后的DataFrame中。在某些情况下，你可能需要在重塑前后进行缺失值处理（例如填充、删除）。索引命名：在整个过程中，保持索引和列的良好命名习惯（通过 set_names()）有助于代码的可读性和可维护性。灵活性：stack(), transpose(), unstack(), pivot_table(), melt() 等Pandas函数提供了强大的数据重塑能力，理解它们的工作原理对于高效处理复杂数据结构至关重要。

通过结合使用 stack()、transpose() 和 Index.map()，我们可以灵活地将复杂的MultiIndex DataFrame重塑为满足特定分析和展示需求的结构。这种方法在处理时间序列数据、交叉表格数据或需要改变数据透视角度时尤其有用。

以上就是Pandas DataFrame高级重塑：将多级列索引转换为行索引与合并列名的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1378965.html

pdf

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Django 模板中列表数据的高效迭代与访问技巧

上一篇 2025年12月14日 20:15:22

利用Pandas与NumPy高效构建坐标DataFrame

下一篇 2025年12月14日 20:15:32

好文分享

html5框架怎么设置_html5用iframe或div框架集嵌入子页面搭整体结构【设置】

HTML5中应使用iframe、div+CSS、object或Web Components替代已废弃的frameset/frame；iframe支持同源嵌入，div+CSS结合JavaScript可动态加载内容，object提供降级支持，Web Components实现可复用嵌入。如果您希望使用 …

程序猿
2025年12月23日
1000
好文分享

html5怎么连接网页_HT5用a标签href属性实现网页间跳转连接【连接】

HTML5页面跳转有五种方式：一、用绝对URL跳转外部网页；二、用相对URL跳转站内页面；三、用锚点链接实现页内定位；四、用空链接结合JavaScript动态跳转；五、用download属性强制下载文件。如果您希望在HTML5网页中实现页面之间的跳转，最基础且常用的方式是使用标签的href属性建立…

程序猿
2025年12月23日
0000
好文分享

html5如何嵌入pdf文档_html5pdf嵌入代码示例与属性配置【攻略】

HTML5提供三种原生PDF嵌入方式：①标签，轻量兼容，需设src、width、height和type；②标签，支持备用内容，data和type必填；③标签，适合跨域PDF，需注意X-Frame-Options和CSP策略。如果您希望在网页中直接显示PDF文件，而不是让用户下载或跳转到外部阅读器，…

程序猿
2025年12月23日
0000
好文分享

美篇如何转换成html_将美篇内容转换为HTML格式文件【文件】

可借助三种方法将美篇图文保存为本地HTML文件：一、用浏览器开发者工具手动提取并整理DOM结构；二、使用SingleFile等第三方工具自动抓取生成；三、通过Python脚本自动化解析与清洗网页内容。如果您希望将美篇平台发布的图文内容保存为本地可编辑、可离线查看的HTML文件，但美篇本身未提供直接…

程序猿
2025年12月23日
1000
好文分享

html5传文件实现_FormData与File API上传文件【方法】

HTML5文件上传支持单/多文件、带字段及进度监控，核心方案为FormData配合XMLHttpRequest或Fetch，辅以FileReader预览、客户端校验等增强功能。如果您需要在网页中实现文件上传功能，HTML5 提供了 FormData 与 File API 的组合方案，可支持单文件、…

程序猿
2025年12月23日
0000
好文分享

ai格式如何转html_将AI设计文件转换为HTML页面流程【转换】

可将AI设计稿转为HTML页面：一、导出SVG嵌入HTML；二、用Anima等工具生成HTML+CSS；三、手动重绘并编写代码。如果您拥有Adobe Illustrator（AI）格式的设计稿，但需要将其呈现为可在浏览器中直接运行的HTML页面，则需通过特定工具或手动方式将矢量图形、图层结构和样式…

程序猿
2025年12月23日
0000
好文分享

.HTML文件如何打印输出_页面打印设置技巧【指南】

高质量HTML打印需四步：一、浏览器打印设置调边距为最小、关闭背景图形、缩放设100%；二、用@media print隐藏导航栏等非必要元素并设分页；三、另存为PDF再打印以锁定排版；四、临时禁用JavaScript确保DOM静态完整。如果您希望将.HTML文件直接打印输出，但发现页面布局错乱、内…

程序猿
2025年12月23日
0000
好文分享

HTML5如何上传文档_HTML5文档上传实现与文件传输技巧【指南】

HTML5文档上传需结合input file控件、XMLHttpRequest进度监控、Fetch+AbortController中断控制、前端校验及分片断点续传。。 2、为该元素绑定 change 事件监听器，当用户选择文件后触发回调函数。立即学习“前端免费学习笔记（深入）”； 3、在回调中通…

程序猿
2025年12月23日
1000
好文分享

html如何另存_将HTML页面另存为其他格式文件【格式】

可将HTML页面保存为PDF、纯文本、Markdown、图像或DOCX格式：一、浏览器打印功能导出PDF；二、开发者工具执行document.body.innerText提取纯文本；三、安装扩展如“Save as Markdown”转为Markdown；四、用Win+Shift+S截图后存为PNG/…

程序猿
2025年12月23日
2000
好文分享

html5支持框架技术_iframe与框架替代方案解析【方法】

HTML5中iframe仍被支持但使用场景已变，现代替代方案包括object、Web Components、AJAX动态加载及实验性portal，各具隔离性、语义性或性能优势。如果您在开发网页时需要嵌入外部内容或实现页面模块化布局，HTML5 中的 iframe 元素仍被支持，但其使用场景与传统框…

程序猿
2025年12月23日
0000
好文分享

html5如何添加链接_HTML5添加超链接标签与属性【链接】

HTML5用标签创建超链接，需设href属性指向目标；用target控制打开方式（如_blank）；用id和#实现页面内锚点跳转；download属性强制下载文件；title和rel提升可访问性与安全性。如果您希望在网页中实现页面跳转或资源引用，HTML5 使用标签来创建超链接。以下是添加超链接…

程序猿
2025年12月23日
0000
好文分享

html中如何做超链接_在HTML页面中创建点击超链接方法【点击】

HTML中实现跳转需用a标签：一、外部链接设href为完整URL；二、本地文件用相对路径；三、页面内锚点用id与#href匹配；四、新窗口打开加target=”_blank”及rel属性；五、下载链接添加download属性。如果您希望在HTML页面中实现点击跳转到其他网页…

程序猿
2025年12月23日
0000
好文分享

HTML如何连接文字与链接_锚标签使用技巧【详解】

HTML中锚标签（）用于实现文字跳转，包括页面内ID跳转、外部网页链接、新窗口打开、文件下载及样式定制，需注意ID唯一性、URL规范、安全性（rel属性）和可访问性。如果您希望在HTML页面中实现文字与特定位置或外部资源的跳转连接，则需要使用锚标签（）进行定义。以下是锚标签在不同场景下的具体应用方…

程序猿
2025年12月23日
0000
好文分享

html5该如何入门_HTML5初学者入门学习路径与资源【入门】

HTML5是网页开发必学基础语言，需掌握文档结构、语义化标签、多媒体嵌入、本地开发环境搭建及权威学习资源。如果您刚开始接触网页开发，希望掌握现代网页的标准技术，则HTML5是必须学习的基础语言。以下是针对初学者的系统性入门路径与可立即使用的资源：一、理解HTML5的核心定位与文档结构 HTML5…

程序猿
2025年12月23日
0000
好文分享

如何把html嵌入html页面_将一个HTML页面嵌入另一个页面【一个】

可通过iframe、object、JavaScript动态加载、SSI或ES6模块五种方式嵌入HTML页面；iframe最常用且兼容性好，object语义性强但兼容性略差，JavaScript适合局部加载，SSI服务端处理无跨域问题，ES6模块适用于现代模块化项目。如果您希望在一个HTML页面中显…

程序猿
2025年12月23日
0000
好文分享

使用Markdown构建可定制的富文本输入与实时预览功能

本教程将指导您如何利用markdown语法和客户端javascript解析库，如marked.js，创建一个支持用户自定义格式（如粗体、斜体、引用等）的帖子输入框，并实现实时预览功能。通过简单的html、css和javascript代码，您可以轻松为用户提供一个功能强大且易于使用的文本编辑体验。引…

程序猿
2025年12月23日
0000
好文分享

html如何传送文件_使用HTML表单实现文件上传功能【上传】

需配置form的method=”post”和enctype=”multipart/form-data”，添加type=”file”输入框并设匹配后端的name属性，可加multiple、accept、required等属性，辅以…

程序猿
2025年12月23日
0000
好文分享

html5如何控制文件_HTML5文件控制方法与上传管理技巧【教程】

HTML5提供五种核心文件操作方法：一、用input type=”file”选择文件；二、用FileReader异步读取内容；三、用Blob和URL.createObjectURL实现临时预览；四、用FormData构建上传请求体；五、用XMLHttpRequest监控上传进…

程序猿
2025年12月23日
0000
好文分享

GemBox.Document HTML转PDF垂直文本渲染问题及解决方案

本教程旨在解决使用gembox.document将包含css `writing-mode`属性的html转换为pdf时，垂直文本未能正确显示的问题。核心解决方案是升级gembox.document库至支持该属性的最新热修复版本，以确保html中定义的垂直布局在pdf输出中得到精确还原，提升文档转换的…

程序猿
2025年12月23日
0000
好文分享

在React中实现下拉选择器动态加载PDF/内容到iframe

本教程旨在解决在react应用中，通过下拉选择器动态加载外部内容（如pdf文件或图片）到` React中下拉选择器与在现代Web应用开发中，尤其是在React这样的前端框架中，我们经常需要实现用户交互来动态加载内容。一个常见的场景是，用户通过下拉菜单选择一个选项，然后页面上的某个区域（通常是理解…

程序猿
2025年12月23日
1000