【python数据分析】-数据分组和聚合数据分组聚合(一)-分组

本文介绍了Python数据分析中数据分组和聚合的基础知识,通过Seaborn数据集的实例讲解了如何使用GroupBy操作。内容包括按列名、列表、元组、字典以及函数进行分组,并展示了如何删除多余列、进行分组统计以及利用语法糖简化操作。同时提到了层次化索引的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

python数据分析-数据分组聚合(一)-分组

又开始我的好好学习之旅,今天学习数据分析!
今天要学数据分组和聚合,分组统计在数据分析中运用的比较多,还有数据透视表也是数据分析必备的技能,今天来get一下~
1.数据源

数据源:Python第三方库seaborn(用于绘图)中自带的数据

import numpy as np
from pandas import Series,DataFrame
import pandas as pd
import seaborn as sns
tips = sns.load_dataset('tips')
tips.head()

之前调用这个库都是好好的,今天出现了报错
在这里插入图片描述
URLError: <urlopen error [Errno 60] Operation timed out>

大概知道是超时的问题,但是百度了半天没找到原因,有人知道一定要告诉我哇~

只好想别的办法解决这个问题啦~
遇到不会的习惯用??来查看下是不是用错方法了,然后发现这个数据集都在
https://github.com/mwaskom/seaborn-data
在这里插入图片描述
找到小费数据:
https://github.com/mwaskom/seaborn-data/blob/master/tips.csv
用pd.read_html获取数据

df = pd.read_html('https://github.com/mwaskom/seaborn-data/blob/master/tips.csv')
tips=df[0]
tips.head()

这个方法返回的是个列表,所以只要取tips[0],就说所需要的数据了
在这里插入图片描述
嘤嘤嘤,怎么多了一个“Unnamed: 0”,删掉!

tips = tips.drop
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值