python数据分析-数据分组聚合(一)-分组
又开始我的好好学习之旅,今天学习数据分析!
今天要学数据分组和聚合,分组统计在数据分析中运用的比较多,还有数据透视表也是数据分析必备的技能,今天来get一下~
1.数据源
数据源:Python第三方库seaborn(用于绘图)中自带的数据
import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns
tips = sns.load_dataset('tips')
tips.head()
之前调用这个库都是好好的,今天出现了报错

URLError: <urlopen error [Errno 60] Operation timed out>
大概知道是超时的问题,但是百度了半天没找到原因,有人知道一定要告诉我哇~
只好想别的办法解决这个问题啦~
遇到不会的习惯用??来查看下是不是用错方法了,然后发现这个数据集都在
https://github.com/mwaskom/seaborn-data

找到小费数据:
https://github.com/mwaskom/seaborn-data/blob/master/tips.csv
用pd.read_html获取数据
df = pd.read_html('https://github.com/mwaskom/seaborn-data/blob/master/tips.csv')
tips=df[0]
tips.head()
这个方法返回的是个列表,所以只要取tips[0],就说所需要的数据了

嘤嘤嘤,怎么多了一个“Unnamed: 0”,删掉!
tips = tips.drop(

本文介绍了Python数据分析中数据分组和聚合的基础知识,通过Seaborn数据集的实例讲解了如何使用GroupBy操作。内容包括按列名、列表、元组、字典以及函数进行分组,并展示了如何删除多余列、进行分组统计以及利用语法糖简化操作。同时提到了层次化索引的应用。
最低0.47元/天 解锁文章
1720

被折叠的 条评论
为什么被折叠?



