交叉验证(Cross Validation)
什么是交叉验证(Cross Validation)
交叉验证是一种模型验证技术,可用于评估统计分析(模型)结果在其他独立数据集上的泛化能力。它主要用于预测,我们可以用它来评估预测模型在实践中的准确度。
什么是泛化(Generalization)能力呢?
在《[Machine Learning] 回归(Regression)》中有提到,这里简单说明一下:
泛化能力通俗来将是指学习到的模型对未知数据的预测能力。
交叉验证(Cross Validation)的目的
在实际训练中,模型通常对训练数据好,但是对训练数据之外的数据拟合程度差。因此,为了得到可靠稳定的模型,使用交叉验证可以在使用模型进行预测时,准确衡量一个模型在实际数据集上的效果。
交叉验证(Cross Validation)的基本思想
在某种意义下把原始数据进行分组,一部分作为训练集(Training Data),一部分作为验证集(Validation Set),还有一部分作为测试集(Testing Set)。
-
训练集
训练集用于训练模型,即确定模型的参数
-
验证集
验证集用于模型的选择<

交叉验证是一种评估模型泛化能力的技术,通过将数据分为训练集、验证集和测试集来避免过拟合和欠拟合。k折交叉验证在数据有限时尤其有用,通过平均多次验证结果降低误差。交叉验证有助于选择最佳模型并提高预测准确性。
最低0.47元/天 解锁文章
794

被折叠的 条评论
为什么被折叠?



