交叉验证（Cross Validation）

最新推荐文章于 2025-09-27 06:39:14 发布

原创

最新推荐文章于 2025-09-27 06:39:14 发布 · 5.1k 阅读

9 ·

CC 4.0 BY-SA版权

交叉验证是一种统计学上的数据切分方法，用于评估模型性能。常见的交叉验证形式包括Hold-Out、Leave-p-out和k-fold。k-fold交叉验证是最常用的，通过随机将数据划分为k个相等大小的子集，进行k次训练和测试，以提高模型的泛化能力。模型选择通常涉及比较不同模型在交叉验证中的误差，选择误差最小的模型。

交叉验证的定义

交叉验证（Cross Validation），有的时候也称作循环估计（Rotation Estimation），是一种统计学上将数据样本切割成较小子集的实用方法，该理论是由Seymour Geisser提出的。

在模式识别（Pattern Recognition）和机器学习（Machine Learning）的相关研究中，经常会将整个数据集合分成两个部分，分别是训练集合和测试集合。假设 $X$ 是集合全体， $A\subsetneq X$ 是全集 $X$ 的非空真子集，那么非空集合 $X\setminus A \neq \emptyset$ 则是集合 $A$ 在全集 $X$ 中的补集。于是可以先在 $A$ 上面做训练和分析，而集合 $X\setminus A$ 则用来做测试和验证。一开始的集合 $A$ 被称作训练集，而它的补集 $X\setminus A$ 被称作验证集或者测试集。这里有一个重要的观点就是：只有训练集才可以使用在模型的训练之中，而测试集必须在模型训练完成之后才被用来评估模型的误差。

HoldOut检验（Hold-Out Method）

这个方法是将原始的数据集合 $X$ 随机分成两个集合 $A$ 和 $X\setminus A$ ，其中 $A$ 作为训练集， $X\setminus A$ 作为测试集。先使用训练集训练模型，然后利用测试集验证模型的效果，记录最后的分类准确率作为Hold-Out下该模型的性能指标。比方说，处理时间序列模型是否准确的时候，把整个数据集合分成前后两部分，前部分占比70%，后部分占比30%。前部分来进行时间序列模型的训练，后部分用来测试改时间序列的准确性。其准确性可以用MAE，MAPE之类的统计指标来衡量。综上所述，该方法的好处就是处理起来简单，只需要把原始数据分成两个部分即可。但是从严格意义上来说，Hold-Out检验并不算是交叉检验（Cross Validation），因为该方法没有达到交叉检验的思想，而且最后验证准确性的高低和原始数组的分类有很大的关系，所以该方法得到的结果在某些场景中并不具备特别大的说服力。