皮尔逊相关系数计算过程备忘。
首先记录下3个公式:
| 1、皮尔逊相关系数公式: | ![]() |
| 2、协方差公式: | ![]() |
| 3、标准差公式: | s=sqrt(((x1-x)^2 +(x2-x)^2 +......(xn-x)^2)/n)。x为x1~xn的均值(也叫做期望值E[X]) |
本例中使用维基百科中的例子:例如,有5个国家的国民生产总值分别为 10、20、30、50 、80 亿美元。 假设这5个国家 (顺序相同) 的贫困百分比分别为 11%、12%、13%、15%、18%(使用0.11、0.12、0.13、0.15、0.18) 。皮尔逊相关系数计算过程如下:
1、先计算分子XY变量的协方差,我使用E[XY]-E[X]E[Y]公式进行计算:
| 10*0.11= | 1.1 |
| 20*0.12= | 2.4 |
| 30*0.13= | 3.9 |
| 50*0.15= | 7.5 |
| 80*0.18= | 14.4 |
| E[XY]= | (1.1 + 2.4 + 3.9 + 7.5 + 14.4) / 5 = 5.86 |
E[X]=(10+20+30+50+80)/5=38
E[Y]=(0.11+0.12+0.13+0.15+0.18)/5=0.138
计算得出协方差cov(X,Y)结果为5.86-38*0.138=0.616
2、然后计算分母X和Y的标准差
上面已经得出X和Y的均值(期望值E[X],E[Y])分别为38和0.138。
计算X标准差:
| (10-38)^2= | 784 |
| (20-38)^2= | 324 |
| (30-38)^2= | 64 |
| (50-38)^2= | 144 |
| (80-38)^2= | 1764 |
| σX | sqrt((784 + 324 + 64 + 144 + 1764) / 5) = 24.81935... |
计算Y标准差:
| (0.11-0.138)^2= | 0.000784 |
| (0.12-0.138)^2= | 0.000324 |
| (0.13-0.138)^2= | 0.000064 |
| (0.15-0.138)^2= | 0.000144 |
| (0.18-0.138)^2= | 0.001764 |
| σY | sqrt((0.000784 + 0.000324 + 0.000064 + 0.000144 + 0.001764) / 5) = 0.024819... |
计算得出σXσY结果为24.81935...*0.024819...=0.616
3、最终得到皮尔逊相关系数0.616/0.616=1,XY正相关

本文详细介绍了皮尔逊相关系数的计算过程,包括协方差和标准差的计算,通过具体实例展示了如何计算两个变量之间的相关性。计算过程分为三步:计算协方差,计算标准差,最后计算皮尔逊相关系数。


3033

被折叠的 条评论
为什么被折叠?



