missingno绘制缺失数据分布图

本文介绍了使用Python库MissingNo的各种方法来可视化和理解数据集中的缺失值。从矩阵显示到条形图、热图和树状图,MissingNo提供了一套强大的工具,帮助数据分析师和科学家更好地洞察数据质量,以便进行更有效的数据预处理和特征工程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pip install missingno
 
import missingno as msno


无效矩阵的数据密集显示

msno.matrix(data, labels=True)

条形图,msno.bar 是列的无效的简单可视化:

msno.bar(data)

缺失性相关性热图

 missingno相关性热图措施无效的相关性:一个变量的存在或不存在如何强烈影响的另一个的存在:

msno.heatmap(data)

树状图

树形图使用层次聚类算法通过它们的无效性相关性(根据二进制距离测量)将变量彼此相加。在树的每个步骤,基于哪个组合最小化剩余簇的距离来分割变量。变量集越单调,它们的总距离越接近零,并且它们的平均距离(y轴)越接近零。

msno.dendrogram(data)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值