python—分组取top

这篇博客介绍了如何利用Pandas的apply函数处理数据分组时取前三名的问题,特别是当存在并列第三名的情况。作者通过定义top3函数,实现了保留并列第三名的所有记录。这个函数首先获取每组的前三个元素,然后检查剩余数据中是否存在与第三名相同值的记录,将这些记录一并加入最终结果。最后,应用这个函数到数据集的每个分组上,得到满足条件的聚合结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写代码时遇上一个分组取top的问题,要求分组取前三,但如果后面有跟第三并列的数值也要纳入进来,因此考虑使用apply函数。

def top3(df):
    df_1 = df.head(3)
    df_2 = df_1.iloc[-1] #前n条的最后一条
    df_3 = pd.concat([df, df_1]).drop_duplicates(keep=False) #去除前n条的数据
    df_4 = df_3[(df_3['到期收益率(%)']==df_2['到期收益率(%)'])] #在未选入的数据中查找
    df_fin = pd.concat([df_1,df_4])
    return df_fin

final3 = final2.groupby('发行人全称').apply(top3)

通过apply对分组的各组进行操作。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值