主成分分析及其相关算法在机器学习中的应用
在机器学习和优化领域,主成分分析(PCA)及其相关算法是处理高维数据的重要工具。本文将详细介绍增量PCA、概率PCA、期望最大化(EM)算法及其在线变体,以及线性判别分析(LDA),并通过实验展示它们在人脸识别等任务中的应用。
1. 增量PCA
当数据集过大无法全部加载到内存时,增量PCA(IPCA)是PCA的一种替代方案。它使用与输入样本数量无关的内存大小来构建近似,不过仍依赖于观测数据的特征。传统PCA在处理大数据集时,由于内存需求和计算成本的问题,难以进行扩展。而IPCA经过三十多年的研究,旨在解决这一扩展性问题。
IPCA主要分为两类:
- 显式计算协方差矩阵 :通过高效估计和遗忘平均技术来确定旧数据和新数据的保留率。例如,[16]中的算法通过以下步骤计算IPCA:
Algorithm 2: Algorithm for computing IPCA
Input: Data samples
Output: The first k principal components v1, v2, v3, ..., vk
Steps;
1. Set of observation X = {x1, x2, x3, ..., xN }; X ∈ RM × N
2. For n = 1, 2, ..., do the following
a. x1(n) = x(n).
b. For i = 1, 2, ..., min(k, n), do:
i. If i = n, initiali
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



