相关分析
函数关系:
相关关系:影响不存在方向性,比如身高越高体重越重,但不能说身高增加1cm体重增加2kg
相关分析不具有传递性,A和C相关,B和C相关,A和B不一定相关
相关系数的显著性检验
#1.两两相关性[有相关系数有p值]
correlation=[]
for I in car_corr[['weight','circle','horsepower']].columns:
correlation.append(stats.pearsonr(car_corr['max_speed'],car_corr[I]))
#1.2 仅有p值
from sklearn.feature_selection import f_regression
F,P_value=f_regression(car_corr[['weight','circle','horsepower']],car_corr['max_speed'])
#2. df的相关系数矩阵[只有相关系数,没有p值]
car_corr[['weight','circle','horsepower','Max_speed']].corr()
#2.2
np.corrcoef((car_corr['Weight'],car_corr['circle'],car_corr['horsepower'],car_corr['Max_speed']))
偏相关分析
发动机作为汽车的心脏,对各项指标有影响。因此,在研究其他指标和最高时速指标之间的相关关系是,会不知不觉在变量之间加入发动机相关指标,对所研究的变量有影响,而这种影响由于相关关系的不可传递性,往往会得到错误的结论
剔除其他变量影响之后再进行相关分析
def partial_corr(x,y,partical=[]):
#x,y为考察相关关系的变量,partical为控制变量
xy,xyp=stats

本文探讨了Python中相关分析的各种方法,包括相关系数的显著性检验、偏相关分析、点二列相关分析以及非参数相关分析。在相关分析中,强调了相关关系的特性,如非传递性和方向性无关。在关联分析部分,提到了如何处理连续变量与分类变量的关系,以及使用如FP-growth算法处理0-1型数据的需求。
最低0.47元/天 解锁文章
1027

被折叠的 条评论
为什么被折叠?



