LDA （Linear Discriminate Analysis）Fisher Criteria

最新推荐文章于 2024-04-18 15:00:59 发布

转载最新推荐文章于 2024-04-18 15:00:59 发布 · 2.1k 阅读

·

0

·

机器学习数学专栏收录该内容

50 篇文章

订阅专栏

本文探讨了PCA（主成分分析）和LDA（线性判别分析）这两种常用的数据降维方法。PCA旨在寻找数据方差最大的方向以减少数据维度，而LDA则专注于最大化不同类别间数据的分离程度。文章详细介绍了LDA的成本函数及其实现过程，并通过Matlab示例展示了如何使用LDA进行分类。

之前说到的PCA，它主要的目的是寻找数据variance变化最大的轴。通过删去数据中variance变化不大的轴来压缩数据的维数。PCA没有办法很好的解决数据分类的问题（classification）。

LDA or Fisher Discriminate Analysis 是一种用于分类数据的分析方法。他的目的是寻找到一条直线，当把所有数据点投影到直线上之后，尽可能的分开不同类别的训练数据。

很容易想到，每个类别训练数据投影到直线后的平均数的差可以做为衡量这条直线好坏的一个标准。

再考虑到不同类数据的variance之后，最终的cost function被定义为：

Scatter就是variance乘以n。n是这个类数据的个数。

我们可以定义Within the class matrix：

S_w = S₁ + S₂；（这里的s1和s2是投影前的scatter）

定义between class matrix为：

S_B = (u1-u2)(u1-u2)^t

定义V为我们要找的直线的unit vector

重新整理cost function后，得到：（这里就不细讲了）

我们的目标就是最大化J（v）。

同样的，我们取J（v）的微分：

又是一个eigenvector的问题。

已知：

所以：

当S_w是full rank的时候，

下面是matlab测试结果：

上下两个绿色的点就是两团数据在直线上投影的点的平均数，LDA就是找出一条线，尽量让投影的平均数的差（除以scatter）最大化。中间的绿点是上下两个绿点的平均数。过中间绿点垂直于LDA line的线就可以做为separating line，用来对test sample进行分类。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。