21、数据可视化与分组操作全解析

数据可视化与分组操作的全面解析

数据可视化与分组操作全解析

1. 直方图与密度图

1.1 直方图

直方图是一种条形图,用于离散化显示数值的频率。它将数据点分割成离散且等间距的区间(bin),并绘制每个区间内数据点的数量。以之前的小费数据为例,我们可以使用 Series plot.hist 方法绘制总账单中小费百分比的直方图:

tips["tip_pct"].plot.hist(bins=50)

1.2 密度图

密度图是通过计算可能生成观测数据的连续概率分布的估计值而形成的。通常的做法是将该分布近似为“核”的混合,例如正态分布。因此,密度图也被称为核密度估计(KDE)图。使用 plot.density 可以绘制基于常规正态混合估计的密度图:

tips["tip_pct"].plot.density()

绘制这种图需要安装 SciPy ,如果尚未安装,可以使用以下命令进行安装:

conda install scipy

1.3 使用 seaborn 绘制直方图和密度图

seaborn histplot 方法使绘制直方图和密

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值