衡量线性回归法的指标:MSE, RMSE和MAE

本文详细探讨了线性回归模型的几种评估指标,包括MSE、RMSE、MAE及R方等,并对比了它们之间的差异及适用场景,旨在帮助读者理解如何选择合适的指标来评估模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

举个栗子:

对于简单线性回归,目标是找到a,b 使得尽可能小

其实相当于是对训练数据集而言的,即

当我们找到a,b后,对于测试数据集而言

,理所当然,其衡量标准可以是

但问题是,这个衡量标准和m相关。

(当10000个样本误差累积是100,而1000个样本误差累积却达到了80,虽然80<100,但我们却不能说第二个模型优于第一个)

改进==> 对式子除以m,使得其与测试样本m无关

 -> 

 但又有一个问题,之前算这个公式时为了保证其每项为正,且可导(所以没用绝对值的表示方法),我们对式子加了一个平方。但这可能会导致量纲的问题,如房子价格为万元,平方后就成了万元的平方。

又改进==> 对MSE开方,使量纲相同

->

 MSE与RMSE的区别仅在于对量纲是否敏感

 又一思路,通过加绝对值

 -> 

在推导a,b的式子时(对train数据集),没用求绝对值的方法是因为其不是处处可导,不方便用来求极值。但评价模型时,对test数据集我们完全可以使用求绝对值的方式。

 P.S. 评价模型的标准和训练模型时最优化的目标函数是可以完全不一样的。

RMSE vs MAE 

RMSE 与 MAE 的量纲相同,但求出结果后我们会发现RMSE比MAE的要大一些。

这是因为RMSE是先对误差进行平方的累加后再开方,它其实是放大了较大误差之间的差距。

而MAE反应的就是真实误差。因此在衡量中使RMSE的值越小其意义越大,因为它的值能反映其最大误差也是比较小的。

衡量线性回归法最好的指标 R Squared

对于上述的衡量方法,如RMSE和MAE还是有问题的,还是因为量纲不一样。比如我们预测考试分数误差是10,预测房价误差是1w。但我们却不能评价我们的模型是更适合预测分数还是预测房价。

解决方法==> 新的指标:R方

(上:y预测-y真,our model,下:y真平均-y真,baseline model)

 使用baseline模型肯定会产生很多错误,我们自己的模型产生的错误会少一些。

1 - ourModelError / baselineModelError = 我们模型拟合住的部分

 R方将回归结果归约到了0~1间,允许我们对不同问题的预测结果进行比对了。

我们可发现,上面其实就是MSE,下面就是方差

<think>嗯,用户想了解机器学习中各种误差度量的区别应用场景,包括SSE、MAEMSERMSE、MAPE、NMAE这些。首先,我需要逐个解释每个指标的定义、计算公式、特点以及适用场景。然后比较它们的优缺点,帮助用户理解在什么情况下应该选择哪种指标。 先从SSE开始,SSE是误差平方,属于平方损失函数,它对大误差比较敏感,容易受异常值影响。可能适用于需要强调大误差的情况,比如在模型初期筛选特征时使用,但需要结合其他指标一起分析。 然后是MAE,平均绝对误差。它计算的是绝对值的平均,对异常值更鲁棒,适用于数据中有较多异常值的情况,比如金融领域的某些预测问题。MAE的缺点是没有方向性,无区分正负误差,但能直接反映平均误差大小。 接下来是MSE,均方误差。平方后的误差会放大较大误差的影响,所以对异常值敏感。MSE在训练模型时常用,因为它具有可导性,适合梯度下降优化。不过因为量纲问题,通常会用RMSE,即均方根误差,使其量纲与原数据一致,更容易解释。RMSE在评价模型整体性能时很常见,比如房价预测,但同样对异常值敏感。 MAPE是平均绝对百分比误差,用百分比表示,便于不同量纲的数据比较,适合商业场景中的需求预测。但它的缺点是在实际值接近零时会导致数值不稳定,甚至无穷大,所以不适合零附近波动的数据。 NMAE是归一化的平均绝对误差,通过除以数据范围或均值来标准化,使得不同数据集之间的比较更公平。比如在电力需求预测中,不同地区的数据规模差异大,用NMAE可以消除量纲影响。 接下来需要比较这些指标之间的区别,比如鲁棒性、量纲问题、适用场景。比如MAEMSE在异常值处理上的不同,或者MAPENMAE在标准化方面的异同。 还要注意引用用户提供的资料。用户引用了三个来源,其中提到了MAERMSE、NMAE指标,需要将这些引用自然地融入到回答中,比如在解释MAE时引用文献2,提到NMAE时引用文献13。 另外,用户可能的应用场景是什么?他们可能在模型评估阶段需要选择合适的指标,或者在处理不同数据分布时调整误差度量的选择。例如,数据含有异常值时建议使用MAE或Huber损失,而需要比较不同量纲的模型时使用MAPE或NMAE。 最后,生成相关问题,帮助用户进一步理解,比如如何选择适合的误差指标,或者在特定场景下的最佳实践。相关问题需要围绕这些指标的应用比较展开。 可能需要注意的细节包括确保公式正确,使用$$...$$格式,行内公式用$...$。例如,MAE的公式是$$\text{MAE} = \frac{1}{n}\sum_{i=1}^n |y_i - \hat{y}_i|$$,而SSE是$$\text{SSE} = \sum_{i=1}^n (y_i - \hat{y}_i)^2$$。需要检查每个公式的LaTeX是否正确,尤其是上下标括号。 总结步骤: 1. 分别介绍每个指标的定义、公式、特点、应用场景。 2. 对比它们的优缺点,突出不同情况下的适用性。 3. 引用用户提供的文献中的相关内容,例如MAE对异常值的鲁棒性[^2],NMAE的归一化方[^1][^3]。 4. 生成相关问题,帮助用户深入探讨。 需要避免的错误包括混淆RMSEMSE的关系,或者误用MAPE的场景。同时,确保回答结构清晰,分点明确,便于用户理解。</think>### 误差度量的概念、区别与应用场景 在机器学习中,误差度量用于量化模型预测值与真实值之间的差异。以下是常见误差指标的定义、特点及适用场景的详细分析: --- #### 1. **SSE(Sum of Squared Errors,误差平方)** - **公式**: $$\text{SSE} = \sum_{i=1}^n (y_i - \hat{y}_i)^2$$ - **特点**: - 对误差进行平方,放大较大误差的影响,对异常值敏感。 - 是MSE的基础,但未取平均,量纲与原数据平方一致。 - **应用场景**: - 常用于模型优化目标(如线性回归的最小二乘)[^2]; - 适合需要强调大误差的模型初筛场景。 --- #### 2. **MAE(Mean Absolute Error,平均绝对误差)** - **公式**: $$\text{MAE} = \frac{1}{n}\sum_{i=1}^n |y_i - \hat{y}_i|$$ - **特点**: - 直接反映预测值与真实值的平均绝对差异,对异常值鲁棒。 - 计算简单,但无区分误差方向(正/负)。 - **应用场景**: - 数据包含较多异常值(如金融风险评估); - 需要稳定评估模型性能的场景。 --- #### 3. **MSE(Mean Squared Error,均方误差)** - **公式**: $$\text{MSE} = \frac{1}{n}\sum_{i=1}^n (y_i - \hat{y}_i)^2$$ - **特点**: - 放大较大误差,对异常值敏感,但数学性质良好(可导),适合梯度下降优化。 - 量纲与原数据平方一致。 - **应用场景**: - 回归模型训练时的损失函数; - 需要快速收敛的优化问题。 --- #### 4. **RMSE(Root Mean Squared Error,均方根误差)** - **公式**: $$\text{RMSE} = \sqrt{\text{MSE}}$$ - **特点**: - 量纲与原数据一致,更易解释; - 仍对异常值敏感,但比MSE更直观。 - **应用场景**: - 模型性能的最终评价(如房价预测); - 需要平衡误差大小解释性的场景。 --- #### 5. **MAPE(Mean Absolute Percentage Error,平均绝对百分比误差)** - **公式**: $$\text{MAPE} = \frac{100\%}{n}\sum_{i=1}^n \left|\frac{y_i - \hat{y}_i}{y_i}\right|$$ - **特点**: - 以百分比表示误差,便于跨量纲比较; - 当真实值接近零时不稳定(分母过小)。 - **应用场景**: - 商业需求预测(如销量、库存); - 数据规模差异较大的比较。 --- #### 6. **NMAE(Normalized Mean Absolute Error,归一化平均绝对误差)** - **公式**: $$\text{NMAE} = \frac{\text{MAE}}{\text{数据范围或均值}}$$ - **特点**: - 通过归一化消除量纲影响,适合不同数据集的横向对比[^1]。 - **应用场景**: - 标准化评估(如电力需求预测[^3]); - 多模型或多场景性能对比。 --- ### 关键区别与选择建议 | 指标 | 鲁棒性 | 量纲敏感性 | 适用场景 | |-------|--------|------------|------------------------------| | SSE | 低 | 平方量纲 | 模型优化目标 | | MAE | 高 | 原量纲 | 含异常值的数据 | | MSE | 低 | 平方量纲 | 梯度下降优化 | | RMSE | 低 | 原量纲 | 最终性能评价 | | MAPE | 中 | 百分比 | 跨量纲比较(避免零值) | | NMAE | 高 | 无 | 标准化评估(多数据集对比) | --- ### 示例代码(Python实现) ```python import numpy as np def calculate_metrics(y_true, y_pred): sse = np.sum((y_true - y_pred)**2) mae = np.mean(np.abs(y_true - y_pred)) mse = np.mean((y_true - y_pred)**2) rmse = np.sqrt(mse) mape = 100 * np.mean(np.abs((y_true - y_pred)/y_true)) nmae = mae / (np.max(y_true) - np.min(y_true)) return {"SSE": sse, "MAE": mae, "MSE": mse, "RMSE": rmse, "MAPE": mape, "NMAE": nmae} ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值