
本文介绍了如何使用 tabulate 库在 Pandas DataFrame 打印的表格中垂直连接文本摘要。通过对 tabulate 输出进行后处理,可以实现将两个 DataFrame 以表格形式拼接,并在表格下方添加文本摘要的目的。文章提供了两种动态调整摘要列宽的方法,并附有详细的代码示例和输出结果。
在数据分析和报告生成中,我们经常需要将数据以表格的形式呈现,并附带一些文本摘要信息。虽然 Pandas DataFrame 提供了强大的数据处理能力,但直接将 DataFrame 与文本摘要以表格形式垂直拼接打印并不容易。本文将介绍如何利用 tabulate 库实现这一目标。
使用 tabulate 库
tabulate 是一个 Python 库,可以将数据以多种格式打印成表格。它支持多种表格格式,包括 plain, simple, grid, pipe, orgtbl, rst, mediawiki, latex, html, json 和 tsv 等。
首先,确保你已经安装了 tabulate 库。如果没有安装,可以使用 pip 进行安装:
pip install tabulate
示例代码
假设我们有两个 DataFrame:
import pandas as pddata1 = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Height': [165, 182, 177]}df1 = pd.DataFrame(data1)data2 = { 'Summary': ["Alice is the youngest", "Bob is the tallest"]}df2 = pd.DataFrame(data2)
我们的目标是将 df1 和 df2 以表格形式垂直拼接,并在 df1 表格下方显示 df2 的摘要信息。
方法一:固定列宽
第一种方法是手动设置列宽,并使用 tabulate 生成表格,然后将两个表格的字符串拼接起来。
import tabulate as tt.PRESERVE_WHITESPACE = True # 保留空白字符width1 = 10 # 设置列宽width2 = width1 * df1.shape[1] + df1.shape[1]*2 # 计算摘要列宽str1 = t.tabulate(df1.applymap(f'{{:^{width1}}}'.format), list(df1), tablefmt='outline', stralign='center', numalign='center')str2 = t.tabulate(df2.applymap(f'{{:^{width2}}}'.format), df2.columns, tablefmt='outline', stralign='center', numalign='center')print(str1 + 'n' + 'n'.join(str2.splitlines()[1:]))
这段代码首先定义了列宽 width1,然后根据 df1 的列数计算摘要列宽 width2。接着,使用 tabulate 分别生成两个 DataFrame 的表格字符串,并使用字符串拼接将它们连接起来。df1.applymap(f'{{:^{width1}}}’.format) 确保每列都居中对齐并具有相同的宽度。
输出结果如下:
+----+------------+------------+------------+| | Name | Age | Height |+====+============+============+============+| 0 | Alice | 25 | 165 || 1 | Bob | 30 | 182 || 2 | Charlie | 35 | 177 |+----+------------+------------+------------+| | Summary |+====+======================================+| 0 | Alice is the youngest || 1 | Bob is the tallest |+----+--------------------------------------+
方法二:动态调整列宽
第二种方法是动态调整摘要列宽,使其与第一个 DataFrame 的表格宽度一致。
import tabulate as tt.PRESERVE_WHITESPACE = Truestr1 = t.tabulate(df1, list(df1), tablefmt='outline', stralign='center', numalign='center')H = str1.split('n', 1)[0] # 获取第一行L = len(H)-H[1:].index('+')-5 # 计算摘要列宽str2 = t.tabulate(df2.applymap(f'{{:^{L}}}'.format), list(df2), tablefmt='outline', stralign='center', numalign='center')print(str1 + 'n' + 'n'.join(str2.splitlines()[1:]))
这段代码首先生成 df1 的表格字符串 str1,然后通过字符串处理获取表格的宽度信息。具体来说,H = str1.split(‘n’, 1)[0] 获取表格的第一行,L = len(H)-H[1:].index(‘+’)-5 计算出摘要列所需的宽度。最后,使用计算得到的宽度生成 df2 的表格字符串,并将它们连接起来。
输出结果如下:
+----+---------+-------+----------+| | Name | Age | Height |+====+=========+=======+==========+| 0 | Alice | 25 | 165 || 1 | Bob | 30 | 182 || 2 | Charlie | 35 | 177 |+----+---------+-------+----------+| | Summary |+====+============================+| 0 | Alice is the youngest || 1 | Bob is the tallest |+----+----------------------------+
注意事项
确保 tabulate 库已正确安装。t.PRESERVE_WHITESPACE = True 用于保留空白字符,确保表格对齐。可以根据实际需求调整列宽和对齐方式。如果 DataFrame 中包含特殊字符,可能需要进行转义处理。
总结
本文介绍了如何使用 tabulate 库在 Pandas DataFrame 打印的表格中垂直连接文本摘要。通过对 tabulate 输出进行后处理,可以灵活地控制表格的格式和布局,实现将 DataFrame 与文本摘要以表格形式拼接打印的目的。希望本文能够帮助你更好地呈现数据和生成报告。
以上就是如何在打印表格中包含文本摘要?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1366810.html
微信扫一扫
支付宝扫一扫