机器学习（5）——过拟合问题

最新推荐文章于 2021-11-15 15:37:25 发布

原创最新推荐文章于 2021-11-15 15:37:25 发布 · 1.2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #过拟合 #正则化

机器学习专栏收录该内容

6 篇文章

订阅专栏

本文探讨了机器学习中常见的过拟合问题，并详细介绍了两种解决过拟合的方法：减少特征数量与正则化。针对线性回归与逻辑回归，文章提供了具体的正则化实施步骤与梯度下降更新公式。

下面主要总结线性回归与逻辑回归下的过拟合问题。

【过拟合问题的定义】

这里写图片描述

【过拟合问题的解决方法】
怎样解决过拟合问题呢？两个方法：
1. 减少feature个数（人工定义留多少个feature、算法选取这些feature）
2. 正则化（留下所有的feature，但对于部分feature定义其parameter非常小）
下面我们将对线性回归与逻辑回归的正则化进行详细的讲解。

【一、线性回归的正则化】

过拟合现象如图（右）所示
这里写图片描述
试想在不改变特征数的条件下，如何使这些特征更好的拟合数据呢？？由图（中）可知，当没有特征x3跟x4时，拟合效果更好；那么如果theta3、theta4都接近于0，特征x3跟x4的作用将会很小，那么拟合效果会接近于图中

因此，我们定义带有正则项的代价函数如下：
这里写图片描述
粉线为正则化后的拟合图像。
注意：正则项中不包含theta0，因为theta0一般是一个较大的数；lambda不能太大，太大的话θ（1~n）≈0.

那么此时线性回归的梯度下降更新公式如下：
这里写图片描述

此外线性回归的正则方程如下：
这里写图片描述

【二、逻辑回归的正则化】

过拟合现象如图右所示
这里写图片描述

带有正则项的代价函数如下：
这里写图片描述

那么此时逻辑回归的梯度下降更新公式如下：
这里写图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。