kaggle练习题、pandas练习题(Exercise: Grouping and Sorting)

group这个函数可以在python中实现类似excel表格中数据透视表的可视化效果

ignore_indexreset_index()的区别:
前者是方法中的一个参数,后者是一个方法。
前者是新dataframe从0开始计数,后者是将分组后的数据(数据透视表形式)划为面板数据
idxmax()这个方法可以找到当前列最大值对应的索引
9.5号发现个set_index()方法,这个方法是设置索引方便join进行表连接。reset_index()和set_index()是完全不同是两个方法。

方法介绍

group函数用法

1.实现value_counts()的效果

reviews.groupby('points').points.count()	#计算不同数据的出现次数

在这里插入图片描述

2.计算分组情况下各组price的最小值是多少

reviews.groupby('points').price.min()  	

![在这里插入图片描述](https://img-blog.csdnimg.cn/0046276056164db3824d9d1b3346c30d.pngpic_center

3.分组后通过lambda函数计算各组title的第一行数据

reviews.groupby('winery').apply(lambda df: df.title.iloc[0])

在这里插入图片描述

4.分组后通过lambda函数计算各组中points最高的index对应的行

reviews.groupby(['country', 'province']).apply(lambda<
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值