Hi, 你好. 我是茶桁.
这一节课一开始我们要说一个非常重要的概念: 拟合.
拟合
相信只要你关注机器学习, 那么多少在某些场合下都会听到拟合这个概念.
什么叫做拟合,什么叫做过拟合或者欠拟合呢?
假如有一个模型, 这个模型在训练数据的时候效果很好, 体现在loss很小, 或者说precision很高, accuracy也比较好, 但是在实际情况下, 用到没有见过的数据的时候,效果就很差, 那么这个就过拟合了.
在这个过程中,要主一的是仅当数据label比较均衡的时候, 才有必要使用acc.
我们来看三条曲线:
第一个图是比较合理的参数模型, 第二个图就是过拟合的参数模型.
因为对数据过度拟合, 当有新的点出现的时候, 函数的趋势和新的点并不匹配. 那过度拟合就会对于未来的点就预测不对了. 为了在训练的时候效果