一、经验误差与过拟合
误差:学习器的实际预测输出与样本的真实输出之间的差异。
训练误差:学习器在训练集上的误差。
泛化误差:在新样本上的误差。
过拟合与欠拟合问题
P.S NP问题为非确定性多项式(non-deterministic polynomial),只可用一定数量的运算解决多项式时间内可解决的问题(多项式时间:在计算复杂度理论中,指的是一个问题的计算时间m(n)不大于问题大小n的多项式倍数)
参考博文:http://blog.youkuaiyun.com/u014295667/article/details/47090639
二、评估方法
1、留出法
将数据集D划分成两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即D=S∪T,S∩T=Φ