机器学习——LDA

本文详细介绍了LDA(线性判别分析)的步骤,包括计算类内散度矩阵、类间散度矩阵,以及如何通过求解特征值和特征向量来构建投影矩阵W,实现数据的降维。主要目标是最大化类别间的中心距离并最小化同类样本的协方差。

步骤:

1 计算类内散度矩阵S_w

2 计算类间散度矩阵S_b

3 计算矩阵S_w^{-1}S_b

4 计算矩阵S_w^{-1}S_b的最大值的d个特征值

5 计算d个特征值对应的d个特征向量,计算投影矩阵为W

6 输出新样本集\bar{D}={(p1,y1),(p2,y2)...(pm,ym)}

具体推导:

定义:

N_j(j=0,1) j 类样本个数       X_j(j=0,1) j 类样本集合        u_j(j=0,1) j 类样本均值  \sum_j(j=0,1) j 类协方差矩阵

u_j = \frac{\sum _{x\varepsilon X_j}x}{N_j} 均值             \sum j=(x-u_j)(x-u_j)^T 协方差矩阵

主要目标思想:1 最大化类别的数据中心距离   \left \| w^Tu_0-w^Tu1\right \|_2^2

                         2 最小化同类样本的协方差   w^T\sum _0w+w^T\sum _1w

类内散度:S_w =\sum_0 + \sum_1 = \sum_{X0}(x-u0)(x-u0)^T + \sum_{X1}(x-u1)(x-u1)^T

类间散度:S_b=(u_0-u_1)(u_0-u_1)^T

优化目标:J(w)=\frac{\left \| w^Tu_0-w^Tu1\right \|_2^2}{w^T\sum _0w+w^T\sum _1w}=\frac{w^TS_bw}{w^TS_ww}

求导 =>{​{J_w}'} =\frac{(w^TS_ww)2S_bw-(w^TS_bw)2S_ww)}{(w^TS_ww)^2}=0   (注释:(w^TS_ww)(w^TS_bw)为标量)

        =>  S_w^{-1}S_bw=\lambda w

这就转化成一个求取特征值与特征向量的问题,可以利用SVD分解

将得到的

计算矩阵S_w^{-1}S_b的最大值的d个特征值

计算d个特征值对应的d个特征向量,计算投影矩阵为W

输出新样本集\bar{D}={(p1,y1),(p2,y2)...(pm,ym)}

对于多分类相似,不再赘述,可参考:https://zhuanlan.zhihu.com/p/27899927

 

 

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值