判别分析-Fisher判别法

首先我们考虑均值和协方差的作用:
   总体的均值就代表总体的中心位置,而协方差矩阵则是可以用来衡量数据的离散程度,Fisher判别法的核心是希望能够找到一个直线投影方向,使得属于各个总体的数据在这个方向上离散程度尽可能的小,也就是数据尽可能的聚集到一块。同时又希望在这个方向上两个总体之间的间隔能尽可能的大,这样有利于分类。

​   我们把平面上的点投影到这个直线上,使得两个总体在这个直线上的投影尽可能地分开,就像把两堆混乱分布的点通过投影变得更有区分度一样。然后根据在这个直线上的位置(通过和判别阈值比较)来判断动物属于哪个总体。

为什么协方差矩阵可以用来衡量数据的离散程度?

​ 对角线上的元素是特征自身的方差,方差越大就代表:
σ 2 = 1 n − 1 ∑ i = 1 n ( x i − x ‾ ) 2 \sigma^2 = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_i - \overline{x})^2 σ2=n11i=1n(xix)2
​ 值越大,就代表这些样本点距离中心越远,就代表数据的分布越分散

​ 非对角线上的元素是特征之间的协方差:
C o v ( X , Y ) = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) Cov(X,Y) = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_i - \bar{x})(y_i - \bar{y}) Cov(X,Y)=n11i=1n(xixˉ)(yiyˉ)
​ 如果协方差的值>0,此时就代表 ( x i − x ˉ ) ( y i − y ˉ ) > 0 (x_i - \bar{x})(y_i - \bar{y}) > 0 (xixˉ)(yiyˉ)>0的情况较多,这就代表 x i , y i x_i,y_i xi,yi都大于均值或者都小于均值的情况较多,这就代表x,y 两个特征之间变化趋势相同的更多,也就是x变大y变大或者x变小y变小的情况更多,存在相关性。小于0的情况同理。

​ 那么两个变量在数据空间中有一定的 “同向” 变化趋势。这种趋势反映了它们在数据空间中的一种 “联合离散程度”。

​ 利于Cov(x,y)>0,而x的离散程度较大,那么y的离散程度也会比较大。

  我们假设有两个总体 G 1 G_1 G1 G 2 G_2 G2,均值分别是 μ 1 \mu_1 μ1 μ 2 \mu_2 μ2,且有共同的协方差矩阵 ∑ \sum

  我们希望找到一个直线的投影方向 α \alpha α,使得来自 G 1 G_1 G1的数据 X ( 1 ) \boldsymbol X^{(1)} X(1)映射为 Y 1 Y_1 Y1,且 Y 1 = a T X ( 1 ) Y_1 = \boldsymbol a^T \boldsymbol X^{(1)} Y1=aTX(1)

  使得来自 G 2 G_2 G2的数据 X ( 2 ) \boldsymbol X^{(2)} X(2)映射为 Y 2 Y_2 Y2,且 Y 2 = a T X ( 2 ) Y_2 = \boldsymbol a^T \boldsymbol X^{(2)} Y2=aTX(2)

  使得 Y 1 , Y 2 Y_1,Y_2 Y1,Y2的距离最大。

我们用一维马氏距离来表示距离,则新的变量的均值和协方差矩阵为:
E Y 1 = a T μ 1 , E Y 2 = a T μ 2 , Var ( Y 1 ) = Var ( Y 2 ) = a T Σ a . E Y_1 = \boldsymbol a^T \boldsymbol\mu_1, \quad E Y_2 = \boldsymbol a^T \boldsymbol\mu_2, \\ \text{Var}(Y_1) = \text{Var}(Y_2) = \boldsymbol a^T \Sigma \boldsymbol a . EY1=aTμ1,EY2=aTμ2,Var(Y1)=Var(Y2)=aTΣa.
计算一维马氏距离:
d = max ⁡ a ∈ R p [ a T ( μ 1 − μ 2 ) ] 2 a T Σ a . d =\max_{\boldsymbol a \in \mathbb R^p} \frac{ \left[\boldsymbol a^T(\boldsymbol\mu_1 - \boldsymbol\mu_2) \right]^2 } { \boldsymbol a^T \Sigma \boldsymbol a } . d=aRpmaxaTΣa[aT(μ1μ2)]2.
再次回顾目标,我们的目标是通过调整 α \alpha α使得d最大。

此时我们引入已知的定理:

a = c Σ − 1 ( μ 1 − μ 2 ) \boldsymbol a = c \Sigma^{-1}(\boldsymbol\mu_1 - \boldsymbol\mu_2) a=cΣ1(μ1μ2)时, c ≠ 0 c\neq 0 c=0且为常数,d可以取得最大值

此时我们另 y = a T x = ( μ 1 − μ 2 ) T Σ − 1 x y= \boldsymbol a^T \boldsymbol x = (\boldsymbol\mu_1 - \boldsymbol\mu_2)^T \Sigma^{-1} \boldsymbol x y=aTx=(μ1μ2)TΣ1x,为判别函数

取两个新变量的均值的均值得到中心:
μ y = 1 2 ( E Y 1 + E Y 2 ) = 1 2 a T ( μ 1 + μ 2 ) = 1 2 ( μ 1 − μ 2 ) T Σ − 1 ( μ 1 + μ 2 ) , \mu_y = \frac12(E Y_1 + E Y_2) = \frac12 \boldsymbol a^T (\boldsymbol\mu_1 + \boldsymbol\mu_2) \\ = \frac12 (\boldsymbol\mu_1 - \boldsymbol\mu_2)^T \Sigma^{-1} (\boldsymbol\mu_1 + \boldsymbol\mu_2), μy=21(EY1+EY2)=21aT(μ1+μ2)=21(μ1μ2)TΣ1(μ1+μ2),
则可以推导出:
E Y 1 − μ y = a T ( μ 1 − μ 1 − μ 2 2 ) = 1 2 ( μ 1 − μ 2 ) T Σ − 1 ( μ 1 − μ 2 ) > 0 , E Y 2 − μ y = a T ( μ 2 − μ 1 − μ 2 2 ) = − 1 2 ( μ 1 − μ 2 ) T Σ − 1 ( μ 1 − μ 2 ) < 0. EY_1 - \mu_y = \boldsymbol a^T \left( \boldsymbol\mu_1 - \frac{\boldsymbol\mu_1 - \boldsymbol\mu_2}{2} \right) \\ = \frac12 (\boldsymbol\mu_1 - \boldsymbol\mu_2)^T \Sigma^{-1} (\boldsymbol\mu_1 - \boldsymbol\mu_2) > 0, \\ EY_2 - \mu_y = \boldsymbol a^T \left( \boldsymbol\mu_2 - \frac{\boldsymbol\mu_1 - \boldsymbol\mu_2}{2} \right) \\ = -\frac12 (\boldsymbol\mu_1 - \boldsymbol\mu_2)^T \Sigma^{-1} (\boldsymbol\mu_1 - \boldsymbol\mu_2) < 0 . EY1μy=aT(μ12μ1μ2)=21(μ1μ2)TΣ1(μ1μ2)>0,EY2μy=aT(μ22μ1μ2)=21(μ1μ2)TΣ1(μ1μ2)<0.
则判别规则为:
{ 判 x ∈ G 1 , 如果 y = ( μ 1 − μ 2 ) T Σ − 1 x ≥ μ y , 判 x ∈ G 2 , 如果 y = ( μ 1 − μ 2 ) T Σ − 1 x < μ y . \begin{align*} \begin{cases} \text{判} \boldsymbol x \in G_1, & \text{如果} y = (\boldsymbol\mu_1 - \boldsymbol\mu_2)^T \Sigma^{-1} \boldsymbol x \geq \mu_y, \\ \text{判} \boldsymbol x \in G_2, & \text{如果} y = (\boldsymbol\mu_1 - \boldsymbol\mu_2)^T \Sigma^{-1} \boldsymbol x < \mu_y . \end{cases} \end{align*} {xG1,xG2,如果y=(μ1μ2)TΣ1xμy,如果y=(μ1μ2)TΣ1x<μy.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值