感谢
线性判别分析LDA原理总结 讲得非常清楚
笔记
有必要将其自然语言处理领域的LDA区别开来,在自然语言处理领域, LDA是隐含狄利克雷分布(Latent Dirichlet
Allocation,简称LDA),它是一种处理文档的主题模型。
- LDA的思想可以用一句话概括:投影后类内方差最小,类间方差最大。
- 利用了瑞利商的原理,可以用于降维,也可以用于分类。
- 它是一种无监督的降维方法,最多将特征降到类别数k-1的维数(n维特征)
与PCA的差别
- LDA是有监督的降维方法,而PCA是无监督的降维方法
- LDA降维最多降到类别数k-1的维数,而PCA没有这个限制。
- LDA除了可以用于降维,还可以用于分类。
- LDA选择分类性能最好的投影方向,而PCA选择样本点投影具有最大方差的方向。
与PCA的相同点
- 均假设数据符合高斯分布(即需要对数据进行标准化)
- 均利用了矩阵分解的思想