1.数据准备
关键一步,使用pandas的corr函数生成相关矩阵。
from string import ascii_letters
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import palettable
# 生成随机数
rs = np.random.RandomState(33)#类似np.random.seed,即每次括号中的种子33不变,每次可获得相同的随机数
d = pd.DataFrame(data=rs.normal(size=(100, 26)),#normal生成高斯分布的概率密度随机数,需要在变量rs下使用
columns=list(ascii_letters[26:]))
# corr函数计算相关性矩阵(correlation matrix)
dcorr = d.corr(method='pearson')#默认为'pearson'检验,可选'kendall','spearman'

2、seaborn.heatmap绘制correlation heatmap
vmax设置颜色的阈值,根据数据范围确定
data必须是数值型
cmap colormap样式
annot 图片上显示数字
plt.figure(figsize=(11, 9),dpi=100)
sns.heatmap(data=dcorr,

这篇博客介绍了如何利用Python的pandas和seaborn库来生成数据的相关性矩阵,并通过seaborn的heatmap函数绘制相关性热力图。同时,针对seaborn显示中文时遇到的字体问题,提供了清除matplotlib缓存的解决方案,确保能正确显示中文列名。
最低0.47元/天 解锁文章
3269

被折叠的 条评论
为什么被折叠?



