Stanford机器学习---第五讲. 过拟合问题的解决 Regularization

最新推荐文章于 2024-09-20 01:15:00 发布

原创最新推荐文章于 2024-09-20 01:15:00 发布 · 658 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习专栏收录该内容

12 篇文章

订阅专栏

本文探讨了机器学习中过拟合的问题及其解决方案——正则化。详细介绍了正则化如何应用于线性回归和逻辑回归中，并通过调整参数来避免过拟合，确保模型泛化能力。

=============The Problem of Overfitting===============

1.bias大，underfittign

variance大，overfitting

2.logistic回归中的过拟合，注意其函数是logistic，而参数是非线性。因为本身图是线性不可分（除最左）

3.overfitting是由于特征选取太多。或者删掉部分特征（自动算法）；或者regularization

=============Regularization Cost Function============

1.因为θ3，θ4的引入会造成过拟合，所以，在Cost Function里面，增加两项。

这样为使得Cost Function极小，则θ3，θ4越小越好。这样既考虑了特征x3,x4，又解决了

过拟合问题。

2.对于现实总上百个特征，我们也不知道该“收缩”哪个特征，干脆在花费函数里

都“收缩”。

3.下图是加上“收缩”项的结果，粉色图。注意"人"起调节粉红线的作用。

4."人"太大，则θ会很小，于是只剩常数项，underfitting

============Regularized Linear Regression============

1.在加入了regulariztion的cost funciton中，新的梯度下降如下：

实际左右---每次用更小的θ（0.99*θ）去减

2.对于Nomal Equations方法来说，此时求cost funciton中的θ，

则用下述公式：

==========Regularized Logistic Regression================

1.对于Logistic Regression，加入regulariztion后，粉色线才更合理

2.在加入了regulariztion的cost funciton中，新的梯度下降如下：

3.在加入了regulariztion的cost funciton中，新的梯度下降求

θ，使得J(θ)最小的伪码实现。注意：costFunction定义好后要作为fminus的参数

图中，jval表示cost function 表达式，其中最后一项是参数θ的惩罚项；下面是对

各θj求导的梯度，其中θ0没有在惩罚项中，因此gradient不变，θ1~θn分别多了

一项(λ/m)*θj；至此，regularization可以解决linear和logistic的overfitting regression

问题了~

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。