ML9⃣️:过度拟合问题overfitting

本文探讨了过度拟合问题,包括其原因(underfit和variance),以及三种解决策略:增加训练数据、特征选择和正则化。特别介绍了线性回归和逻辑回归中的正则化过程,以及如何选择合适的正则化参数lambda。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 过度拟合

1.1 underfit

  • 有很高的bias
  • 并不能很好的fit我们的training set

1.2 generalization

  • 可以很好的预测不在training set里的数据。

1.3 overfit

  • cost 几乎等于0
  • 无法推广
  • 算法有high variance高方差(overfit的另一种术语)。完全fit training set,如果有一个training set 稍微有点不同就会得到完全不同的预测。请添加图片描述

1.4 对于classification也一样

在这里插入图片描述


2. 如何解决过度拟合(3种)

  1. 收集更多的training set
  2. 选择更合适的feature(x)(减少/增加)
  3. regularization: 减小parameter的size。
    (1)保留所有的feature但要防止feature产生过大的影响。
    (2)b不需要regularization,b的变化几乎不影响。

3. regularization

  1. lambda:regularization parameter,lambda > 0。
  2. 使用第一个term来fit data。
  3. 使用第二个term来minimize w。

请添加图片描述

  1. 如何选择lambda:
  • =0 : f(x) = b
  • 太大:f(x) overfit

3.1 用于linear regression的regularization

  • 偏导后面有过程。
    请添加图片描述

  • 重新排序wj。前一项非常接近 wj。

请添加图片描述

  • 正规项求偏导:最后等于lambda * wj / m,求和项展开,只有wj项会保留。

请添加图片描述

3.2 用于logistic regression的regularization

  • 加上regularization term会使得预测的曲线更加的平滑,避免overfit请添加图片描述

  • 注意:b 不做regularization。
    请添加图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值