机器学习-模型决定系数

决定系数

决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征依变数Y的变异中有多少百分比,可由控制的自变数X来解释.

表达式:R2=SSR/SST=1-SSE/SST

其中:SST=SSR+SSE,SST(total sum of squares)为总平方和,SSR(regression sum of squares)为回归平方和,SSE(error su

### 关于决定系数(R²)的计算方法、使用场景及其含义 #### 计算方法 决定系数 \( R^2 \) 的定义为模型解释的数据变异比例,其核心思想是比较模型预测值与真实值之间的偏差平方和(RSS),以及真实值相对于均值的总偏差平方和(TSS)。\( R^2 \) 可通过以下公式计算: \[ R^2 = 1 - \frac{\text{RSS}}{\text{TSS}} \] 其中, - RSS 表示残差平方和,即 \(\sum_{i=1}^{n}(y_i - \hat{y}_i)^2\); - TSS 表示总平方和,即 \(\sum_{i=1}^{n}(y_i - \bar{y})^2\)。 当模型完全拟合数据时,RSS 将趋近于零,此时 \( R^2 \) 达到最大值 1。如果模型表现极差甚至不如简单的均值估计,则 \( R^2 \) 可能小于零[^5]。 以下是基于 Python 中 `scikit-learn` 库实现 \( R^2 \) 的代码示例: ```python from sklearn.metrics import r2_score # 假设 y_true 是真实值列表,y_pred 是预测值列表 y_true = [3, -0.5, 2, 7] y_pred = [2.5, 0.0, 2, 8] r_squared = r2_score(y_true, y_pred) print(f"R-squared value: {r_squared}") ``` #### 使用场景 决定系数广泛应用于多个领域中的回归分析任务,主要包括但不限于以下几个方面: - **回归模型效果评价**:用于衡量线性回归或多变量回归模型对目标变量变化的解释能力。 - **经济和金融数据分析**:例如评估某项政策或市场因素对经济增长或其他宏观经济指标的影响程度。 - **机器学习模型调优**:作为超参数优化过程的一部分,帮助选择最佳模型结构或调整算法参数。 #### 含义 \( R^2 \) 提供了一种直观的方式来量化模型对观测数据的拟合质量。它反映了由自变量引起的因变量变动部分占全部变动的比例。较高的 \( R^2 \) 值意味着更多的信息被当前模型捕捉到了;然而需要注意的是,即使 \( R^2 \) 很大也可能存在过拟合风险,因此应当结合其他验证手段综合判断模型泛化性能[^1]。 另外值得注意的一点是,在某些特殊情况下 SST 的具体形式可能会依据特定背景有所改变,所以在实际操作过程中需参照相应工具包文档或者权威资料确认确切表达式[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值