Principal Component Analysis

最新推荐文章于 2024-05-18 22:41:35 发布

原创最新推荐文章于 2024-05-18 22:41:35 发布 · 294 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#PCA

ML / Math / Matlab 专栏收录该内容

26 篇文章

订阅专栏

本文深入解析PCA（主成分分析）的数学原理，通过最小重构误差和最大方差两种视角，详细推导PCA如何实现数据降维，适用于高维数据压缩与特征提取。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

PCA（Principal Component Analysis）和 SVD （参考Singular Value Decomposition）一样，也是数据压缩的一种方法！

1 最小重构误差

在这里插入图片描述
图片来自于葫芦书（《百面机器学习》）
中心化就是每个维度都减去该维度的均值！

原来每一个样本点需要 $x$ 和 $y$ 两个维度来表示，如果把样本点投影到上图所示的直线上，样本点仅需要一个维度就可以表示了！

这样原来 $N$ 个样本点，需要 $2 N$ 的参数量，现在只需要 $N + 2$ 的参数量了（达到了降维的目的），2 表示直线的参数量！

问题转化为，最小化原来样本和新样本之间的差值，也即点到直线的距离！！！

在这里插入图片描述
点到支线的距离怎么用向量来表示呢？我们可以画一个上面的图来仔细分析一下！

假设 $\vec{u}$ 为单位向量，由向量的内积公式（ $\cdot$ 表示向量的内积运算），我们可知

$\vec{x}\cdot\vec{u} = |\vec{x}||\vec{u}|cos \theta = |\vec{x}|cos \theta$

上面只是投影的距离（向量的模），加上方向就是向量了，所以 $\vec{x}$ 在 $\vec{u}$ 上的投影向量为：

$Prj_{\vec{u}}{\vec{x}} = (|\vec{x}|cos \theta)\vec{u} = (\vec{x}\cdot\vec{u})\vec{u}$

所以
$\vec{e} = \vec{x} - Prj_{\vec{u}}{\vec{x}} = \vec{x}-(\vec{x}\cdot\vec{u})\vec{u}$

我们简单的表示为如下形式

$\vec{e} = x - (x^Tu)u$

其中， $x$ 和 $u$ 表示列向量 $\vec{x}$ 和 $\vec{u}$ ， $\in \mathbb{R}^n$ ， $\in \mathbb{R}^n$ ，因为 $u$ 是单位向量，所以 $∣ ∣ u ∣ ∣ = 1$ , $u^Tu=1$ ， $x^Tu$ 是标量。

我要最小化误差的平方

$\begin{aligned} J = ||\vec{e}^2|| = \vec{e}^T\vec{e} &= [x - (x^Tu)u]^T[ x - (x^Tu)u] \\ &= [x^T - (x^Tu)u^T][ x - (x^Tu)u]（因为 x^T 是标量）\\ &=x^Tx - (x^Tu)x^Tu - (x^Tu)u^Tx + (x^Tu)(x^Tu)u^Tu（展开） \\ &=x^Tx - (x^Tu)x^Tu - (x^Tu)u^Tx + (x^Tu)^2（因为 u^Tu=1）\\ &=x^Tx - (x^Tu)^2 - (x^Tu)^2 + (x^Tu)^2（因为 x^Tu = u^Tx，都是标量）\\ &=x^Tx - (x^Tu)^2 \end{aligned}$

如果样本集确定了， $x^Tx$ 也是固定的，唯一会改变的是 $x^Tu)^2$ ，所以我们最小化差值的平方 $J$ 等价于最大化 $x^Tu)^2$ 的值！

我们再来转化成二次型的形式：
$\begin{aligned} max(x^Tu)^2 &\Leftrightarrow max (x^Tu)(x^Tu) \\ &\Leftrightarrow max(u^Tx)(x^Tu) \\ &\Leftrightarrow max [u^T(xx^T)u] \end{aligned}$