定义:
过拟合:
训练集表现好,测试集表现不好
欠拟合:
训练集,测试集表现都不好
原因及解决办法:
欠拟合:
特征过少
解决办法:
添加其他特征项
添加多项式特征
过拟合:
特征过多,嘈杂特征,尝试兼顾太多
解决办法:
重新清洗数据
增大数据的训练量
正则化
减少特征维度,防止维灾难
正则化
定义:
在学习的时候,数据提供的特征有些影响模型复杂度或者这个特征的数据的异常点较多,所以在学习的时候尽量减少这个特征的影响,甚至删除,这就是正则化

维灾难

博客介绍了过拟合和欠拟合的定义,过拟合是训练集表现好、测试集表现不好,欠拟合是训练集和测试集表现都不好。分析了二者原因,欠拟合是特征过少,过拟合是特征过多等。还给出解决办法,欠拟合可添加特征,过拟合可清洗数据、增大训练量、正则化等。
定义:
过拟合:
训练集表现好,测试集表现不好
欠拟合:
训练集,测试集表现都不好
原因及解决办法:
欠拟合:
特征过少
解决办法:
添加其他特征项
添加多项式特征
过拟合:
特征过多,嘈杂特征,尝试兼顾太多
解决办法:
重新清洗数据
增大数据的训练量
正则化
减少特征维度,防止维灾难
正则化
定义:
在学习的时候,数据提供的特征有些影响模型复杂度或者这个特征的数据的异常点较多,所以在学习的时候尽量减少这个特征的影响,甚至删除,这就是正则化

维灾难

5391
968
2679

被折叠的 条评论
为什么被折叠?