Python28-7.1降维算法之LDA线性判别分析

线性判别分析(Linear Discriminant Analysis, LDA)是一种用于模式识别机器学习的分类和降维技术。LDA通过找到能最大化类别间方差和最小化类别内方差的投影方向,实现样本的降维和分类。

LDA的基本思想

LDA的核心思想是通过线性变换将数据投影到一个新的空间中,使得同一类别的样本尽可能地紧凑在一起,而不同类别的样本尽可能地分开。具体来说,LDA的目标是找到一个或多个线性判别向量,使得类内散度矩阵(within-class scatter matrix)最小化,而类间散度矩阵(between-class scatter matrix)最大化。

LDA的数学公式

  1. 类内散度矩阵(Within-class scatter matrix):

其中,(S_i) 表示第 (i) 类的散度矩阵,计算方式为:

(mu_i) 是第 (i) 类的均值向量,(C_i) 是第 (i) 类的样本集合。

  1. 类间散度矩阵(Between-class scatter matrix):

    其中,(N_i) 是第 (i) 类的样本数量,(mu_i) 是第 (i) 类的均值向量,(mu) 是所有样本的全局均值向量。

  2. 线性判别准则: 通过求解以下特征值问题来找到投影向量:

    其中,(w) 是判别向量,(\lambda) 是对应的特征值。最大的特征值对应的特征向量是最佳投影方向。

LDA的步骤

  1. 计算每个类别的均值向量

  2. 计算类内散度矩阵和类间散度矩阵

  3. 求解特征值和特征向量,找到最佳投影方向。

  4. 将数据投影到新的空间,进行分类或降维。

LDA的应用

  • 分类问题:LDA可以用于二分类或多分类问题,常用于人脸识别文本分类<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值