
使用Python Pandas为数据列添加序号,并为连续相同的值赋予相同的序号。
许多数据处理任务需要对数据列进行编号,且要求连续相同的数值拥有相同的序号,而不同的数值则序号递增。本文将演示如何利用Python的Pandas库高效地实现此功能。
假设有一列数据:[11, 21, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 23, 26, 26, 26, 26, 20, 26, 26, 26, 26],目标是生成一个序号列,满足连续相同数值拥有相同序号的条件。
我们可以结合Pandas和NumPy库来实现:
立即学习“Python免费学习笔记(深入)”;
import numpy as npimport pandas as pddata = [11, 21, 24, 24, 24, 24, 25, 25, 26, 26, 26, 26, 23, 26, 26, 26, 26, 20, 26, 26, 26, 26]df = pd.DataFrame({'data': data})df['序号'] = (df['data'].diff() != 0).cumsum()print(df)
代码首先创建一个包含原始数据列’data’的Pandas DataFrame。df['data'].diff() != 0 计算相邻元素的差值,并判断是否为0(即数据是否变化)。cumsum() 对结果进行累加,生成最终的序号列’序号’。
输出结果:
data 序号0 11 11 21 22 24 33 24 34 24 35 24 36 25 47 25 48 26 59 26 510 26 511 26 512 23 613 26 714 26 715 26 716 26 717 20 818 26 919 26 920 26 921 26 9
此方法高效地为数据列添加序号,并确保连续相同的值拥有相同的序号。
以上就是Python Pandas如何为数据列添加序号,且连续相同值赋予相同序号?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1358223.html
微信扫一扫
支付宝扫一扫