步骤:
1 计算类内散度矩阵
2 计算类间散度矩阵
3 计算矩阵
4 计算矩阵的最大值的d个特征值
5 计算d个特征值对应的d个特征向量,计算投影矩阵为W
6 输出新样本集={(p1,y1),(p2,y2)...(pm,ym)}
具体推导:
定义:
j 类样本个数
j 类样本集合
j 类样本均值
j 类协方差矩阵
均值
协方差矩阵
主要目标思想:1 最大化类别的数据中心距离
2 最小化同类样本的协方差
类内散度:
类间散度:
优化目标:J(w)=
求导 => (注释:
与
为标量)
=>
这就转化成一个求取特征值与特征向量的问题,可以利用SVD分解
将得到的
计算矩阵的最大值的d个特征值
计算d个特征值对应的d个特征向量,计算投影矩阵为W
输出新样本集={(p1,y1),(p2,y2)...(pm,ym)}
对于多分类相似,不再赘述,可参考:https://zhuanlan.zhihu.com/p/27899927

本文详细介绍了LDA(线性判别分析)的步骤,包括计算类内散度矩阵、类间散度矩阵,以及如何通过求解特征值和特征向量来构建投影矩阵W,实现数据的降维。主要目标是最大化类别间的中心距离并最小化同类样本的协方差。
9645

被折叠的 条评论
为什么被折叠?



