python数据分析-数据分组聚合(一)-分组
又开始我的好好学习之旅,今天学习数据分析!

今天要学数据分组和聚合,分组统计在数据分析中运用的比较多,还有数据透视表也是数据分析必备的技能,今天来get一下~
1.数据源
数据源:Python第三方库seaborn(用于绘图)中自带的数据
import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns
tips = sns.load_dataset('tips')
tips.head()
之前调用这个库都是好好的,今天出现了报错
URLError: <urlopen error [Errno 60] Operation timed out>
大概知道是超时的问题,但是百度了半天没找到原因,有人知道一定要告诉我哇~
只好想别的办法解决这个问题啦~
遇到不会的习惯用??来查看下是不是用错方法了,然后发现这个数据集都在
https://github.com/mwaskom/seaborn-data
找到小费数据:
https://github.com/mwaskom/seaborn-data/blob/master/tips.csv
用pd.read_html获取数据
df = pd.read_html('https://github.com/mwaskom/seaborn-data/blob/master/tips.csv')
tips=df[0]
tips.head()
这个方法返回的是个列表,所以只要取tips[0],就说所需要的数据了
嘤嘤嘤,怎么多了一个“Unnamed: 0”,删掉!
tips = tips.drop