测试集问题
测试集和训练集应该"互斥"
常见的方法:
- 留出法
- 交叉验证法
- 自助法
留出法:
把训练集分成两部分,要保持数据的分布一致性
k-折交叉验证法
轮转来当作测试集,这样每一个测试集都被测试过了。
自助法:
基于自助采样。
亦称“有放回采样”、“可重复采样”。
验证集
训练集中专门留出来调参数的部分。看参数怎么设置才是好的。
算法参数选定后,要用 “训练集+验证集” 重新训练最终模型。
调参数的过程应该从训练集中来,而不是测试集中。
测试集问题
测试集和训练集应该"互斥"
常见的方法:
轮转来当作测试集,这样每一个测试集都被测试过了。
自助法:
基于自助采样。
亦称“有放回采样”、“可重复采样”。
验证集
训练集中专门留出来调参数的部分。看参数怎么设置才是好的。
算法参数选定后,要用 “训练集+验证集” 重新训练最终模型。
调参数的过程应该从训练集中来,而不是测试集中。