89、主成分分析(PCA)及其在特征分区框架中的应用

主成分分析(PCA)及其在特征分区框架中的应用

1. 主成分分析(PCA)概述

主成分分析(PCA)是一种子空间方法,它作用于数据集的整体模式,旨在找到一个低维子空间,用于将数据从高维空间转换到低维空间。所选的子空间(即PCA空间)代表了给定数据集最大方差的方向,PCA的目的是在低维空间中找到最准确的数据表示。

1.1 协方差矩阵的计算

假设训练集由 $N$ 个维度为 $d$ 的向量 $V_i$($i = 1, 2, \cdots, N$)组成,均值向量用 $\overline{V}$ 表示,协方差矩阵 $C_{PCA}$ 的计算公式如下:
[
C_{PCA} = \frac{1}{N} \sum_{i = 1}^{N} (V_i - \overline{V})(V_i - \overline{V})^T
]
其中,
[
\overline{V} = \frac{1}{N} \sum_{i = 1}^{N} V_i
]

1.2 主成分的计算

$e_{opt}$ 是 $C_{PCA}$ 对应最大特征值的最优投影方向(轴)。通常会选择一组投影方向(轴)$e_1, e_2, \cdots, e_{d’}$ 来最大化特征向量的强度,这些最优投影方向是 $C_{PCA}$ 前 $d’$ 个最大特征值对应的正交归一特征向量。设 $E_{PCA} = [e_{PCA}^1 \cdots e_{PCA}^2 \cdots \cdots e_{PCA}^{d’}] {d \times d’}$ 是对应 $d’$ 个最大特征值的特征向量。对于输入向量 $V_i$,其主成分(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值