如何用Python高效地为数据列添加连续序号,使相同值拥有相同序号?

如何用python高效地为数据列添加连续序号,使相同值拥有相同序号?

高效处理重复数据:为Pandas数据列添加连续序号

在数据分析中,常常需要根据数据列的值,生成一列连续序号,且要求相同的值拥有相同的序号,不同值则序号递增。本文将演示如何使用Python的Pandas库高效实现此功能。

问题描述:

给定一列数据,需要生成对应的序号列。如果数据列中相邻值相同,则赋予相同的序号;如果相邻值不同,则序号递增。例如,数据列[11, 21, 24, 24, 24, 25, 25],生成的序号列应为[1, 2, 3, 3, 3, 4, 4]

立即学习“Python免费学习笔记(深入)”;

解决方案:

利用Pandas和NumPy库,我们可以简洁地解决这个问题。以下代码展示了具体实现:

import numpy as npimport pandas as pddata = [11, 21, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 23, 26, 26, 26, 26, 20, 26, 26, 26, 26]df = pd.DataFrame({'data': data})df['序号'] = np.cumsum(df['data'].diff() != 0) +1print(df)

代码首先创建一个包含数据列’data’的Pandas DataFrame。核心代码df['序号'] = np.cumsum(df['data'].diff() != 0) + 1 计算数据列的差分,判断相邻数据是否相同,并对布尔值结果进行累加,实现序号递增。最后加1是为了序号从1开始。最终结果如下:

    data  序号0     11     11     21     22     24     33     24     34     24     35     24     36     25     47     25     48     26     59     26     510    26     511    26     512    23     613    26     714    26     715    26     716    26     717    20     818    26     919    26     920    26     921    26     9

这段代码简洁高效地实现了为数据列添加连续序号的功能,满足了题目要求。

以上就是如何用Python高效地为数据列添加连续序号,使相同值拥有相同序号?的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1358121.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月13日 21:34:00
下一篇 2025年12月10日 04:29:40

相关推荐

发表回复

登录后才能评论
关注微信