模型选择调优,可以解决K值的问题
交叉验证:
将拿到的训练数据,分为训练集和验证集。以下图为例,将数据分成4份,其中一份做成验证集,然后经过4次测试,每次都更换不同的验证集,即得到4组模型结果,取平均值作为最终结果,又称4折交叉验证
交叉验证之后,被评估的模型更加准确。
超参数搜索——网格搜索
选择k的取值
通常情况下,有很多参数是需要手动指定的,(knn算法中的k),这叫做超参数,但是手动过程复杂,所以需要对模型预设几种超参数组合,每组组合参数都采用交叉验证来进行评估, 最后选出最优参数组合建立模型。