2.5.1
2.5.1.1
Principal component analysis(PCA)用n维垂直向量表达原特征们尽可能多的信息。
whiten=True设置向量们各自的标准差都是1。高斯核的SVM和K-Means可能会用到。
PCA可以对各个特征的贡献进行评分,这可以用在交叉验证当中。
2.5.1.2
Incremental PCA
PCA的一个限制是必须将数据集全部加载进内存中,对于大数据集用Incremental PCA,它使用不同的处理获得与PCA相近的结果。
2.5.1.3
http://scikit-learn.org/stable/modules/decomposition.html#decompositions
本文介绍了主成分分析(PCA)算法的基本原理及其应用场景。PCA能够通过转换将原始特征映射到一组新的正交变量上,这些变量被称为主成分。此外,文中还提到了PCA的一种变种——增量PCA,该方法特别适用于大数据集的处理。
1431

被折叠的 条评论
为什么被折叠?



