14-过拟合和欠拟合

过拟合和欠拟合的概念
**欠拟合和过拟合**
在这里插入图片描述
模型复杂的原因:数据的特征和目标值之间的关系不仅仅是线性关系

欠拟合的原因:学习到数据的特征过少
解决办法:增加数据的特征数量

过拟合的原因:原始特征过多,存在一些嘈杂特征,模型过于复杂是因为模型尝试去兼顾各个测试数据点
解决办法:

  1. 进行特征选择,消除关联性大的特征(很难做)
  2. 进行交叉验证(进行检验,而不是消除。让所有数据都有过训练)
  3. 正则化

根据结果现象来判断过拟合和欠拟合

  • 交叉验证
    • 训练集结果欠拟合表现不行;过拟合表现好
    • 测试集:欠拟合表现不行;过拟合表现不行

回归解决过拟合:L2正则化

作用:可以使得W的每个元素(特征值的权重)都很小,都接近于0,通过调试,使得某些特征的w(权重,即系数)特别小,从而简化减小其对模型的影响,消除过拟合

优点:越小的参数说明模型越简单,越简单的模型则越不
容易产生过拟合现象

L2正则化:Ridge:岭回归 带有正则化的线性回归 解决过拟合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值