无监督学习-主成分分析(Unsupervised Learning-Principle Component Analysis)

#无监督学习-主成分分析
Principle Component Analysis
主成分分析
聚类(Clustering)
在这里插入图片描述
HAC层次凝聚的聚类
在这里插入图片描述
在这里插入图片描述
降维
Feature selection
Feature selectio:去掉没用的维度。
PCA
在这里插入图片描述
基于特征值分解协方差矩阵实现PCA算法
因为S 是数据的协方差矩阵,所有具有一些性质:

S是对称的(Symmetric)
S是半正定矩阵(Positive-semidefinite): 设S SS为实对称矩阵,若对于每个非零实向量X ,都有XTSX≥0 X^TSX\ge 0X
T
SX≥0,则称A为半正定矩阵,称XTSX X^TSXX
T
SX为半正定二次型。
S SS的特征值(eigenvalues)都是非负的
eigenvector是特征向量
通过推导得到结论:
计算数据矩阵的协方差矩阵,然后得到协方差矩阵的特征值特征向量,选择特征值最大(即方差最大)的k个特征所对应的特征向量组成的矩阵。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
基于SVD分解协方差矩阵实现PCA算法
在定义中一个digit由component线性组成,再加一个digit的平均
digit: x xx
digits的平均: x¯ \bar x xˉcomponent线性组成: xˆ \hat x x^x¯ \bar x xˉ和x xx是已知的,目标就是最小化x−x¯ x-\bar xx− xˉ 与xˆ \hat x x^ 之间的重构误差(reconstruction error)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
PCA通过神经网络实现
注意这时候W不能保证是正交矩阵
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值