
利用Pandas高效查找:找出DataFrame中比当前行’col3’列值大的数据个数
本文介绍一种高效方法,使用Pandas在DataFrame中,针对每一行查找’col3’列的值在之前所有行中比它大的值的个数,并将结果添加到新的’col4’列。
问题描述:给定包含’col1’、’col2’和’col3’三列的Pandas DataFrame,目标是为每一行添加’col4’列,’col4’的值表示从当前行向上查找,在遇到第一个比当前行’col3’列值大的值之前,中间有多少个值。
示例数据:
col1 col2 col30 5.5 2.5 10.01 2.0 4.5 1.02 2.5 5.2 8.03 4.5 5.8 4.84 4.6 6.3 9.65 4.1 6.4 9.06 5.1 2.3 3.07 5.1 2.3 11.18 5.1 2.3 10.09 5.1 2.3 11.110 5.1 2.3 20.011 5.1 2.3 31.012 5.1 2.3 5.0
避免低效的循环方法,我们采用NumPy的向量化计算:
import numpy as npimport pandas as pddata = [[5.5, 2.5, 10.0], [2.0, 4.5, 1.0], [2.5, 5.2, 8.0],[4.5, 5.8, 4.8], [4.6, 6.3, 9.6],[4.1, 6.4, 9.0],[5.1, 2.3, 3],[5.1, 2.3, 11.1],[5.1, 2.3, 10],[5.1, 2.3, 11.1],[5.1, 2.3, 20],[5.1, 2.3, 31],[5.1, 2.3, 5]]df = pd.DataFrame(data, columns=['col1', 'col2', 'col3'])df['col4'] = [np.sum(df['col3'][:i+1].values > val) for i, val in enumerate(df['col3'])]print(df)
代码中,我们使用列表推导式和NumPy的sum()函数进行向量化计算,高效地计算每一行的’col4’值。
最终结果:
col1 col2 col3 col40 5.5 2.5 10.0 01 2.0 4.5 1.0 02 2.5 5.2 8.0 13 4.5 5.8 4.8 04 4.6 6.3 9.6 35 4.1 6.4 9.0 06 5.1 2.3 3.0 07 5.1 2.3 11.1 78 5.1 2.3 10.0 09 5.1 2.3 11.1 110 5.1 2.3 20.0 1011 5.1 2.3 31.0 1112 5.1 2.3 5.0 0
以上就是Pandas中如何高效查找比当前行值大的数据个数?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1358697.html
微信扫一扫
支付宝扫一扫