机器学习基础与线性回归详解
1. 模型误差评估
在模型评估中,误差计算是关键环节,但正负误差可能相互抵消,导致总体误差看似为零,而实际上模型在单个数据点上表现不佳。为避免这一问题,我们可以采用以下两种方法:
- 绝对误差 :考虑模型的绝对误差,避免正负误差相互抵消。例如,若一个误差为 +20,另一个为 -20,总体误差看似为 0,但绝对误差为 40,绝对误差率为 40 / 200 = 20%。
- 均方根误差(RMSE) :将误差平方(负数的平方为正数)来解决误差符号不一致的问题。示例如下:
| 数据点 | 实际值 | 预测值 | 误差 | 平方误差 |
| ---- | ---- | ---- | ---- | ---- |
| 1 | 100 | 120 | 20 | 400 |
| 2 | 100 | 80 | -20 | 400 |
| 总体 | 200 | 200 | 0 | 800 |
总体平方误差为 800,均方根误差(RMSE)是 (800 / 2) 的平方根,即 20。
2. 混淆矩阵
绝对误差和 RMSE 适用于预测连续变量,而对于离散结果的事件预测,则需要使用其他相关指标,混淆矩阵就是其中之一。它统计模型预测事件结果的实例数量,并与实际值进行对比:
| | 预测为欺诈 | 预测为非欺诈 |
| ---- | ---- | ---- |
| 实际为欺诈 | 真阳性(TP) | 假阴性(FN) |
| 实际为非欺诈 | 假阳性(FP) | 真阴性(TN)
超级会员免费看
订阅专栏 解锁全文
1406

被折叠的 条评论
为什么被折叠?



