group这个函数可以在python中实现类似excel表格中数据透视表的可视化效果
ignore_index
和reset_index()
的区别:
前者是方法中的一个参数,后者是一个方法。
前者是新dataframe从0开始计数,后者是将分组后的数据(数据透视表形式)划为面板数据
idxmax()
这个方法可以找到当前列最大值对应的索引
9.5号发现个set_index()
方法,这个方法是设置索引方便join进行表连接。reset_index()和set_index()是完全不同是两个方法。
文章目录
方法介绍
group函数用法
1.实现value_counts()的效果
reviews.groupby('points').points.count() #计算不同数据的出现次数
2.计算分组情况下各组price的最小值是多少
reviews.groupby('points').price.min()
3.分组后通过lambda函数计算各组title的第一行数据
reviews.groupby('winery').apply(lambda df: df.title.iloc[0])
4.分组后通过lambda函数计算各组中points最高的index对应的行
reviews.groupby(['country', 'province']).apply(lambda<