白化的目的:
白化是一种重要的预处理过程,其目的就是降低输入数据的冗余性,使得经过白化处理的输入数据具有如下性质:
(i) 特征之间相关性较低,使数据的不同维度去相关;
(ii) 所有特征具有相同的方差,使数据每个维度的方差为1.
条件1要求数据的协方差矩阵是个对角阵;条件2要求数据的协方差矩阵是个单位矩阵。
为什么使用白化
假设训练数据是图像,由于图像中相邻像素之间具有很强的相关性,所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性。
因为这目前不是我关注的重点,所以没有深入探讨。希望后面有空可以补充。
更多细节可参考:
本文介绍白化处理作为数据预处理的重要手段,旨在减少输入数据的冗余性,通过去除特征间的相关性和标准化方差来提升模型训练效率。特别讨论了在图像数据上的应用,并对比了PCA白化与ZCA白化的区别。
1072

被折叠的 条评论
为什么被折叠?



