一、概述
机器学习模型经过训练后必须使用测试集进行评估。我们这样做是为了确保模型没有过度拟合,并确保它们适用于现实生活中的数据集,与训练集相比,这些数据集的分布可能略有偏差。
模型评估通常通过保留拆分执行,其中通常进行 80/20 拆分,并且80%的数据集用于训练模型。 20% 用于评估模型。但是为了使模型真正健壮,仅使用训练/测试拆分进行评估可能还不够。K-fold 交叉验证。通过跨多个折叠生成训练/测试拆分,您可以使用不同的拆分执行多个训练和测试会话。另外我们将了解如何将 K 折交叉验证与 PyTorch、Tensorflow 结合使用。
K-fold交叉验证
K-fold交叉验证是一种更强大的评估技术。 它将原始数据分成K组(K-Fold),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型。
&nb