数据处理、降维--线性判别分析(linear discriminant analysis LDA)

博客指出在处理有标签的有监督数据时,PCA无法很好找到投影方向使变换后数据方差最大,因此引入LDA。定义了原始数据集,设定了投影后数据类内方差最大、类间方差最小的目标,并给出了相应的优化参数公式。

建议先看PCA这一节。在遇到下面的数据类型时(数据有标签,为有监督),PCA不能很好的找到一个投影方向使得变换后的数据方差最大。

于是引入LDA。

定义原始数据集为$x = (x_{1},x_{2},,x_{n},y_{i})$,m个

样本,n个特征,i类标签(为公式简练,i=2)

设y1的数据均值为u1,对应散布矩阵为S1,y2为u2,S2。          下文加 ~ 表示投影以后。

目的:

投影后数据类内方差最大类间方差最小

根据要求定义一个优化参数:

$J=\frac{\left | \widetilde{\mu _{1}}-\widetilde{\mu _{2}} \right |^{2}}{\widetilde{S_{1}^{2}}+\widetilde{S_{2}^{2}}}$

(公式复杂,照片凑数)

 

转载于:https://www.cnblogs.com/super-yb/p/11184530.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值