从SVM过来发现在选择特征的时候需要用到PCA,这样选的特征就有很好的区分度,更容易进行预测工作。
摸索了好几天,其实是拖延了好几天。
终于认为我行了。。写一下理解后的心得
首先膜拜下大神,看一下这个链接
https://zhuanlan.zhihu.com/p/77151308
上面写的很全面了,从基变换到协方差矩阵对角化说的很清楚。
我再捋一遍PCA求解步骤:
设有 m 条 n 维数据。
1、将原始数据按列组成 n 行 m 列矩阵 X;
2、将 X 的每一行进行零均值化,即减去这一行的均值;
3、求出协方差矩阵 C=1mXXTC=\frac{1}{m}XX^TC=