相关系数与决定系数的关系

 

决定系数是相关系数的平方。 相关系数是用来描述两个变量之间的线性关系的,但决定系数的适用范围更广,可以用于描述非线性或者有两个及两个以上自变量的相关关系。
决定系数的意义是变量A可以解释变量B方差的多少。
因此,相关系数的意义(为正的情况)就是变量A可以解释变量B标准差的多少。
更直接的解释是,由于变量A的变动,变量B增加了C,而这C中有r的比例是因为变量A的变动造成的。
举例:
比如模型中责任心对工作绩效一般有10%的预测力,也就是说决定系数是0.1。因此,推论到上述直接的解释上,也就意味着某人工作绩效量增加了C,这C中有大约32%是因为某人责任心的增加而增加的。
 
### 相关系数决定系数的概念及计算 #### 一、相关系数 相关系数 \( r \) 是衡量两个变量之间线性关系强度方向的指标。其取值范围为 [-1, 1],其中正值表示正相关,负值表示负相关,绝对值越大表明线性关系越强。 相关系数的定义式如下: \[ r = \frac{\sum{(x_i - \bar{x})(y_i - \bar{y})}}{\sqrt{\sum{(x_i - \bar{x})^2}\sum{(y_i - \bar{y})^2}}} \] 这里,\( x_i \) \( y_i \) 表示样本数据点,而 \( \bar{x} \) \( \bar{y} \) 则分别代表自变量 X 因变量 Y 的均值[^1]。 #### 二、决定系数 决定系数 \( R^2 \),也称为判定系数或拟合优度,用于评估回归模型对观察数据的解释能力。它是相关系数 \( r \) 的平方,因此它的取值范围为 [0, 1]。较高的 \( R^2 \) 值意味着更多的变异被模型解释了。 决定系数可以通过以下公式计算得出: \[ R^2 = 1 - \frac{SSE}{SST} \] 其中, - SSE(残差平方):\(\sum(y_i - \hat{y}_i)^2\); - SST(总离差平方):\(\sum(y_i - \bar{y})^2\); 这里的 \( \hat{y}_i \) 是预测值,\( y_i \) 是实际观测值,\( \bar{y} \) 是实际观测值的平均值[^3]。 #### 三、两者的区别联系 尽管相关系数 \( r \) 决定系数 \( R^2 \) 都用来描述变量间的关联程度,但它们有明显的不同之处: - **概念上的差异**:相关系数主要关注的是两个变量之间的线性依赖关系的方向强度,而决定系数则是关于回归模型能够多好地解释响应变量的变化。 - **数值意义的不同**:虽然 \( R^2 = r^2 \)[^2],但是这并不意味着两者完全相同。因为 \( R^2 \) 更加侧重于评价模型的整体性能,尤其是在多元回归的情况下更为明显。 - **适用场景的区别**:对于简单线性回归来说,这两个量可能看起来很相似,但在多重线性回归或者非线性模型中,只有 \( R^2 \) 可以作为整体模型质量的一个指示器[^4]。 另外需要注意,在调整后的决定系数 \( R^2_{adj} \) 中考虑到了自由度的影响因素,使得它成为了一个更加严格的评判标准,尤其适用于复杂模型的选择过程。 ```python import numpy as np def calculate_r(x, y): mean_x = np.mean(x) mean_y = np.mean(y) numerator = sum((xi-mean_x)*(yi-mean_y) for xi,yi in zip(x,y)) denominator = np.sqrt(sum((xi-mean_x)**2 for xi in x)*sum((yi-mean_y)**2 for yi in y)) return numerator/denominator if denominator != 0 else None # Example usage: data_x = [1, 2, 3, 4, 5] data_y = [2, 4, 6, 8, 10] correlation_coefficient = calculate_r(data_x, data_y) print(f'Correlation Coefficient: {correlation_coefficient}') ``` 上述代码展示了如何手动实现相关系数的计算函数 `calculate_r` 并给出了一组简单的例子来进行验证。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值