16、主成分分析(PCA)全面解析与实践

主成分分析(PCA)全面解析与实践

1. 主成分分析基础概念

主成分分析(PCA)是一种用于处理多元数据的重要技术,其核心目标是从数据矩阵 $X \in R^{N\times p}$(其中 $p \leq N$)中获取 $p$ 个向量 $\varphi_1, \varphi_2, \cdots, \varphi_p$。这些向量需满足特定条件:
- $\varphi_1 \in R^N$ 且 $|\varphi_1| = 1$,同时最大化 $|X\varphi_1|$。
- $\varphi_2 \in R^N$ 且 $|\varphi_2| = 1$,与 $\varphi_1$ 正交并最大化 $|X\varphi_2|$。
- 以此类推,$\varphi_p \in R^N$ 且 $|\varphi_p| = 1$,与 $\varphi_1, \cdots, \varphi_{p - 1}$ 正交并最大化 $|X\varphi_p|$。

在进行 PCA 之前,通常会对矩阵 $X$ 进行中心化处理,即从每列元素 $x_{i,j}$($i = 1, \cdots, N$,$j = 1, \cdots, p$)中减去该列的算术平均值 $x_j$。

PCA 的主要目的是将矩阵 $X$ 概括为 $\varphi_1, \cdots, \varphi_m$($1 \leq m \leq p$),$m$ 值越小,$X$ 中的信息压缩程度越高。存在 $\mu_1$ 使得 $X^T X\varphi_1 = \mu_1\varphi_1$。实际上,$\varphi_1$ 最大化 $|X\varphi_1|$,通过对 $L := |X\varphi_1|^2 - \ga

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值