线性判别分析LDA：详解及数学原理

最新推荐文章于 2025-05-18 09:00:00 发布

狂奔的菜鸡

最新推荐文章于 2025-05-18 09:00:00 发布

阅读量1.4k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：协方差 python 机器学习

本文链接：https://blog.youkuaiyun.com/weixin_43786241/article/details/108960451

机器学习专栏收录该内容

22 篇文章

订阅专栏

本文介绍了线性判别分析（LDA）的基本思想和数学原理，它是一种用于监督学习的降维技术。LDA旨在通过最大化类间散度和最小化类内散度来寻找最佳投影方向。文章详细阐述了LDA的目标函数，并通过Python代码展示了如何计算投影向量，从而将数据投影到低维空间中，以实现分类和可视化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

简介

线性判别分析 (Linear Discriminant Analysis，简称 LDA)是一种经典的线性学习方法。并且LDA是一种监督学习的降维技术。

思想：
给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离（有些像中心损失的思想）。
在对新样本进行分类时，将其投影到同样的这条直线上，再根据投影点的位置来确定新样本的类别。
在这里插入图片描述

数学分析

给定数据集 $D\in \lbrace(Xi ， Yi)\rbrace^m_{i-1}$ ，旦 $Y_i \in\lbrace {0， 1 }\rbrace$ ，令 $X_i,\mu_i,\Sigma_i$ 分别表示第 $i\in \lbrace{0 ， 1}\rbrace$ 类样例的集合、均值向量、协方差矩阵。

这里小小的回忆一下协方差与协方差矩阵：协方差矩阵是一个矩阵，其每个元素是各个向量元素之间的协方差。而协方差描述了向量之间的相关程度（关于协方差，可以看这篇博客写的很好：终于明白协方差的意义了）

若将数据投影到直线 $w$ 上，则两类样本的中心在直线上的投影分别为 $w_Tμ_0$ 和 $w_Tμ_1$

若将所有样本点都投影到直线上，则两类样本的协方差分别为 $w_T\Sigma_0w$ 和 $w_T\Sigma_1w$

欲使同类样例的投影点尽可能接近，可以让同类样例投影点的协方差尽可能小：即 $w_T\Sigma_0w+w_T\Sigma_1w$ 尽可能小

使异类样例的投影点尽可能远离，类中心之间的距离尽可能大，即： $w_Tμ_0-w_Tμ_1||^2_2$ 尽可能大（ $||\centerdot ||^2_2$ 为L2范数的平方）

同时考虑二者，即最大化下式：
在这里插入图片描述
类内散度矩阵：

在这里插入图片描述
类问散度矩阵：

在这里插入图片描述
故 $J$ 函数可重写为：

在这里插入图片描述
也被称为 $S_b$ 与 $S_w$ 的"广义瑞利商"

那么 $w$ 如何求呢？

对于广义瑞利商，分子分母上的 $w^T**w$ ，只与其方向有关，我们可以将 $w^TS_ww$ 看作1，因此最大化原函数 $J$ 变为最小化：
在这里插入图片描述
由拉格朗日乘子法，上式等价于：

$S_bw$ 的方向恒为 $μ_0- μ_1$ ，令：

故 $w$ ：

Python实现简单的LDA

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_classification

def func(x, w):
    return np.dot((x), w)

def LDA(X, y):
    # 根据标签分为两个数据集
    X1 = np.array([X[i] for i in range(len(X)) if y[i] == 0])
    X2 = np.array([X[i] for i in range(len(X)) if y[i] == 1])

    len1 = len(X1)
    len2 = len(X2)
    # 求中心点
    X1_Center = np.mean(X1, axis=0)
    print(X1_Center)
    X2_Center = np.mean(X2, axis=0)
    print(X2_Center)
    # 求协方差
    cov1 = np.dot((X1 - X1_Center ).T, (X1 - X1_Center ))
    cov2 = np.dot((X2 - X2_Center).T, (X2 - X2_Center))
    # 求类内散度
    Sw = cov1 + cov2
    # 求w
    # np.mat()将输入解释为一个矩阵
    # np.mat().I求逆
    w = np.dot(np.mat(Sw).I, (X1_Center - X2_Center).reshape((len(X1_Center), 1)))

    # 输出
    X1_new = func(X1, w)
    X2_new = func(X2, w)
    y1_new = [1 for i in range(len1)]
    y2_new = [2 for i in range(len2)]
    return X1_new, X2_new, y1_new, y2_new

if '__main__' == __name__:
    X, y = make_classification(n_samples=500, n_features=2, n_redundant=0, n_classes=2,
                               n_informative=1, n_clusters_per_class=1, class_sep=0.5, random_state=10)

    X1_new, X2_new, y1_new, y2_new = LDA(X, y)

    plt.scatter(X[:, 0], X[:, 1], marker='o', c=y)
    plt.show()

    plt.plot(X1_new, y1_new, 'b*')
    plt.plot(X2_new, y2_new, 'ro')
    plt.show()