通过可视化识别异常值与数据探索
1. 散点图的使用
散点图是查看两个变量之间关系的好方法,还能展示不同数据子集之间的关系。
- 绘制方法 :只需提供 x 和 y 的列名以及数据框即可运行散点图,与运行直方图和箱线图一样,可访问图形及其轴的属性,如标题、轴标签、刻度线和标签等。要访问轴上的标签,需使用 set_xlabels 或 set_ylabels ,而非 xlabels 或 ylabels 。
- 3D 散点图 :绘制 3D 散点图稍复杂,首先要导入 Axes3D 模块,然后将轴的投影设置为 3D,如 plt.axes(projection='3d') ,之后可对每个子图使用 scatter3D 方法。
- 添加回归直线 :散点图用于说明回归变量(x 变量)和因变量之间的关系,在散点图上显示最小二乘回归线很有帮助。Seaborn 提供了 regplot 和 lmplot 两种方法,通常使用 regplot ,因其资源消耗较少,但有时也需要 lmplot 的功能。
- 识别异常值 :通过散点图可查看一些异常值,如葡萄牙的 LAJES_AB 站和美国的 WILD_HORSE_6N 站,其平均温度高于该纬度和
超级会员免费看
订阅专栏 解锁全文
1102

被折叠的 条评论
为什么被折叠?



