Pandas: groupby()

本文介绍了如何使用pandas库中的groupby()函数对DataFrame进行分组处理,通过一个具体的示例,展示了groupby()函数返回的object对象结构,以及如何访问分组后的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

vg = valid1.groupby(['Coupon_id'])

for i in vg:
    print(i)
    print(i[1])
    break

输出如下:

('1',          User_id  Merchant_id Coupon_id Discount_rate Distance Date_received  \
768069    472146         6889         1          20:1        9      20160522   
962551   2266597         6889         1          20:1        0      20160603   
964821   3057133         6889         1          20:1        0      20160606   
1665538  5555255         6889         1          20:1        3      20160530   

             Date discount_type  discount_rate  discount_man    ...      \
768069   20160602             1           0.95            20    ...       
962551       null             1           0.95            20    ...       
964821       null             1           0.95            20    ...       
1665538      null             1           0.95            20    ...       

         weekday_type  weekday_1 weekday_2  weekday_3  weekday_4  weekday_5  \
768069              1          0         0          0          0          0   
962551              0          0         0          0          0          1   
964821              0          1         0          0          0          0   
1665538             0          1         0          0          0          0   

         weekday_6  weekday_7  label  pred_prob  
768069           0          1      1   0.013437  
962551           0          0      0   0.106432  
964821           0          0      0   0.101014  
1665538          0          0      0   0.053949  

[4 rows x 23 columns])
         User_id  Merchant_id Coupon_id Discount_rate Distance Date_received  \
768069    472146         6889         1          20:1        9      20160522   
962551   2266597         6889         1          20:1        0      20160603   
964821   3057133         6889         1          20:1        0      20160606   
1665538  5555255         6889         1          20:1        3      20160530   

             Date discount_type  discount_rate  discount_man    ...      \
768069   20160602             1           0.95            20    ...       
962551       null             1           0.95            20    ...       
964821       null             1           0.95            20    ...       
1665538      null             1           0.95            20    ...       

         weekday_type  weekday_1 weekday_2  weekday_3  weekday_4  weekday_5  \
768069              1          0         0          0          0          0   
962551              0          0         0          0          0          1   
964821              0          1         0          0          0          0   
1665538             0          1         0          0          0          0   

         weekday_6  weekday_7  label  pred_prob  
768069           0          1      1   0.013437  
962551           0          0      0   0.106432  
964821           0          0      0   0.101014  
1665538          0          0      0   0.053949  

[4 rows x 23 columns]

对DataFrame使用groupby()函数后,是一个object对象,里面的子对象是根据参数来分类的,子对象是一个有标签的对象,子对象相当于一个二行N列的矩阵,例如i[0]就是对象分类标签"1", 而i[1]则是DataFrame里面隶属于分类参数标签的元素行,是dataframe格式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值