数据可视化与分组操作全解析
1. 直方图与密度图
1.1 直方图
直方图是一种条形图,用于离散化显示数值的频率。它将数据点分割成离散且等间距的区间(bin),并绘制每个区间内数据点的数量。以之前的小费数据为例,我们可以使用 Series 的 plot.hist 方法绘制总账单中小费百分比的直方图:
tips["tip_pct"].plot.hist(bins=50)
1.2 密度图
密度图是通过计算可能生成观测数据的连续概率分布的估计值而形成的。通常的做法是将该分布近似为“核”的混合,例如正态分布。因此,密度图也被称为核密度估计(KDE)图。使用 plot.density 可以绘制基于常规正态混合估计的密度图:
tips["tip_pct"].plot.density()
绘制这种图需要安装 SciPy ,如果尚未安装,可以使用以下命令进行安装:
conda install scipy
1.3 使用 seaborn 绘制直方图和密度图
seaborn 的 histplot 方法使绘制直方图和密
数据可视化与分组操作的全面解析
超级会员免费看
订阅专栏 解锁全文
1791

被折叠的 条评论
为什么被折叠?



