Python seaborn画热力图(heatmap)删除相关性高的的特征

seaborn.heatmap(data, vmin=None, vmax=None, annot=None,center=None)

重要参数说明:
data: 二维数组,Series,DataFrame(取index和columns)
vmin,vmax:表示热力颜色的最小值和最大值
annot:是否显示具体数值
center:表示热力颜色的中间值,默认会自动调节
更多参数可以在seaborn官网搜索。
https://seaborn.pydata.org/generated/seaborn.heatmap.html?highlight=heatmap#seaborn.heatmap

由于热力图的可视化特性,经常用来研究特征值之间的相关性。
下面是一个房屋特征热力图来研究特征相关性的例子:

correlation=train_data.corr()
plt.subplots(figsize=(12,9))
sns.heatmap(correlation,vmax=0.8)
plt.savefig("../heatmap")

代码中首先对训练集数据取相关系数,用heatmap函数显示热力图。在参数方面选择了vmax来方便找出相关度比较高的特征,由于格子比较密集没有选择用annot显示数值。图中能很方便的看出相关度比较高的特征(白色的)之后地清洗中删去其中之一即可。(有些时候可以使center=0,来找负相关的,本例中没有负相关度高的特征值)

这是一个房屋特征热力图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值