文章目录
线性相关
线性相关分析是描述两变量间直线相关,常用相关系数来描述。
根据数据的分布特性不同可以分为:皮尔逊相关系数(Pearson correlation coefficient )和斯皮尔曼相关系数(Spearman‘s rank correlation coefficient )
皮尔逊相关系数(stats.pearsonr)
适用条件:变量需要满足正态分布
计算表达式:
r = ∑ ( x − m x ) ( y − m y ) ∑ ( x − m x ) 2 ∑ ( y − m y ) 2 r=\frac{\sum\left(x-m_{x}\right)\left(y-m_{y}\right)}{\sqrt{\sum\left(x-m_{x}\right)^{2} \sum\left(y-m_{y}\right)^{2}}} r=∑(x−mx)2∑(y−my)2∑(x−mx

本文介绍了Python中线性相关分析,包括皮尔逊和斯皮尔曼相关系数,并详细讲解了线性拟合的概念,如最小二乘法和R方。通过代码示例展示了如何使用scipy和sklearn库进行相关计算和线性回归分析。
最低0.47元/天 解锁文章
1633





