神经网络中常用的误差平方和损失函数是什么

最新推荐文章于 2025-05-11 11:45:59 发布

啷哩咯啷浪浪浪

最新推荐文章于 2025-05-11 11:45:59 发布

阅读量1.4w

点赞数

分类专栏：神经网络文章标签： NN 深度学习

神经网络专栏收录该内容

24 篇文章

订阅专栏

本文详细介绍了最小二乘法的基本概念及其在线性回归中的应用。解释了为什么选择使用欧氏距离作为误差度量，并给出了平方损失的标准形式。此外还讨论了线性回归中的两种线性情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最小二乘法是线性回归的一种，OLS将问题转化成了一个凸优化问题。在线性回归中，它假设样本和噪声都服从高斯分布（为什么假设成高斯分布呢？其实这里隐藏了一个小知识点，就是中心极限定理，可以参考【central limit theorem】），最后通过极大似然估计（MLE）可以推导出最小二乘式子。最小二乘的基本原则是：最优拟合直线应该是使各点到回归直线的距离和最小的直线，即平方和最小。换言之，OLS是基于距离的，而这个距离就是我们用的最多的欧几里得距离。为什么它会选择使用欧式距离作为误差度量呢（即Mean squared error， MSE），主要有以下几个原因：

简单，计算方便；
欧氏距离是一种很好的相似性度量标准；
在不同的表示域变换后特征性质不变。

平方损失（Square loss）的标准形式如下：

L(Y,f(X))=(Y−f(X))2L(Y,f(X))=(Y−f(X))2

当样本个数为n时，此时的损失函数变为：

L (Y, f (X)) = \sum i = 1 n (Y - f (X)) 2

$L(Y, f(X)) = \sum _{i=1}^{n}(Y - f(X))^2$
Y-f(X)表示的是残差，整个式子表示的是残差的平方和，而我们的目的就是最小化这个目标函数值（注：该式子未加入正则项），也就是最小化残差的平方和（residual sum of squares，RSS）。
而在实际应用中，通常会使用均方差（MSE）作为一项衡量指标，公式如下：

M S E = (\sum i = 1 n (Y - f (X)) 2) / N

$MSE= (\sum _{i=1}^{n}(Y - f(X))^2)/N$

上面提到了线性回归，这里额外补充一句，我们通常说的线性有两种情况，一种是因变量y是自变量x的线性函数，一种是因变量y是参数αα的线性函数。在机器学习中，通常指的都是后一种情况。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。