机器学习中的损失函数

最新推荐文章于 2023-12-22 10:05:47 发布

原创最新推荐文章于 2023-12-22 10:05:47 发布 · 704 阅读

CC 4.0 BY-SA版权

文章标签：

48 篇文章

订阅专栏

本文深入探讨了各种损失函数，包括0-1损失、平方损失、绝对损失、对数损失、指数损失、对率损失和hinge损失。分析了MSE与MAE在处理离群点时的不同表现，介绍了经验风险最小化和结构风险最小化的原则。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

监督学习问题是在假设空间中选取模型作为决策函数，对于给定的输入X，由f(x)给出对应的输出Y，这个输出的预测值可能与真实值一致或不一致，可以用损失函数（loss function） 或 代价函数（cost function） 来度量预测错误的程度。

f (x) = {1, Y \neq f (X) 0, Y = f (X)

$f(x)=\left\{ \begin{aligned} 1, Y \ne f(X) \\ 0, Y = f(X) \end{aligned} \right.$

L (Y, f (X)) = (Y - f (X)) 2

$L(Y,f(X))=(Y-f(X))^2$

def mse(true, pred):
    return np.sum(((true – pred) ** 2))


from sklearn.metrics import mean_squared_error

L (Y, f (X)) = | Y - f (X) |

$L(Y,f(X))=|Y-f(X)|$

def mae(true, pred):
    return np.sum(np.abs(true – pred))

from sklearn.metrics import mean_absolute_error

MSE vs MAE：

由于MSE对误差（e）进行平方操作（y - y_predicted = e），如果e> 1，误差的值会增加很多。如果我们的数据中有一个离群点，e的值将会很高，将会远远大于|e|。这将使得和以MAE为损失的模型相比，以MSE为损失的模型会赋予更高的权重给离群点
MAE损失适用于训练数据被离群点损坏的时候（即，在训练数据而非测试数据中，我们错误地获得了不切实际的过大正值或负值）

如果离群点是会影响业务、而且是应该被检测到的异常值，那么我们应该使用MSE。另一方面，如果我们认为离群点仅仅代表数据损坏，那么我们应该选择MAE作为损失。