贝叶斯观点看曲线拟合

最新推荐文章于 2023-05-16 22:32:47 发布

xieshangxin

最新推荐文章于 2023-05-16 22:32:47 发布

阅读量1.1k

点赞数

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/xieshangxin/article/details/89183072

本文探讨了从贝叶斯角度理解曲线拟合问题，特别是如何通过最小二乘法和正则化来防止过拟合。讨论了L1和L2正则化，指出L2正则化对应于最大后验概率估计，当噪声为高斯分布时，与贝叶斯方法的结论一致。

曲线拟合问题的目标是根据给定的数据集（x,y）预测未知数据x的y，其本身可以归结为最小化误差函数问题。以概率的观点考察曲线拟合，可以更加深刻地理解误差函数以及正则化。

我们看曲线拟合的最小二乘解 $W = (X^{T}X)^{-1}X^{T}Y$ 。如果样本维数很高，或者样本数目不够多，那么 $X^{T}X$ 是不可逆的，就会造成过拟合。一般来说，为了减少过拟合，我们可以增加数据量，对数据进行降维，或者是使用正则化来对w进行约束。

使用正则化方法，则loss function 就会变成 $L(w) + \lambda p(W)$ 。常用的正则化有两种，L1（lasso）或者L2(ridge,岭回归，权重衰减)。以L2 为例, $L(W) = \left \| W^{T}X-Y \right \| ^{2}+ \lambda W^{T}W$ ,展开后关于W求导，并令导数为0，则有：

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

xieshangxin 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。