【机器学习】LDA线性判别分析

最新推荐文章于 2024-07-12 15:12:07 发布

大姨妈V

最新推荐文章于 2024-07-12 15:12:07 发布

阅读量7.5k

点赞数 10

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/u012679707/article/details/80529252

版权

LDA是一种经典的线性学习方法，旨在通过投影让同类样本点尽可能接近，异类样本点尽可能远离。它基于Fisher判别思想，求解最大类间散度与最小类内散度的比值。LDA不仅可以用于二分类问题，还可以推广到多分类任务，是一种监督降维技术。LDA与PCA的主要区别在于LDA利用类别信息，适用于有监督的降维和分类，而PCA是无监督的，并寻找样本点投影的最大方差方向。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【机器学习】LDA线性判别分析

1. LDA的基本思想

2. LDA求解方法

3. 将LDA推广到多分类

4. LDA算法流程

5. LDA和PCA对比

【附录1】瑞利商与广义瑞利商

线性判别分析 (Linear Discriminant Analysis，LDA)是一种经典的线性学习方法，在二分类问题上因为最早由[Fisher，1936]提出，亦称"Fisher判别分析"。（严格说来LDA与Fisher判别分析稍有不同，LDA假设了各类样本的协方差矩阵相同且满秩。）

1. LDA的基本思想

LDA的基本思想是: 给定训练样例集，设法将样例投影到一条直线上，使得同类样例的投影点尽可能接近、异类样例的投影点尽可能远离，在对新样本进行分类时，将其投影到同样的这条直线上，再根据投影点的位置来确定新样本的类别。图3.3给出了一个二维示意图。

2. LDA求解方法

问：LDA最终要求什么？

求投影空间W。 假设要投影到d维空间，W为这最大的d个特征值对应的特征向量张成的矩阵。所以问题转化为求解特征向量w

求解过程如下：

给定数据集，，令Xi、цi、∑i分别表示第i∈{0，1}类示例的集合、均值向量、协方差矩阵。

若将数据投影到直线w上，则两类样本的中心在直线上的投影分别为；若将所有样本点都投影到直线上，则两类样本的协方差分别为。

由于直线是一维空间，因此。

本着同类样例的投影点尽可能接近、异类样例的投影点尽可能远离的原则，欲使同类样例的投影点尽可能接近，可以让同类样例投影点的协方差尽可能小，即尽可能小；而欲使异类样例的投影点尽可能远离，可以让类中心之间的距离尽可能大，即尽可能大。同时考虑二者，则可得到欲最大化的目标

定义"类内散度矩阵"

以及"类间散度矩阵"

则式 (3.32)可重写为

这就是LDA欲最大化的目标，即Sw与Sb的"广义瑞利商" （Rayleigh）。根据广义瑞利商的性质，我们知道我们的J(w)最大值为矩阵的最大特征值，而对应的为的最大特征值对应的特征向量!（具体的瑞利商的知识见【附录1】）

如何求解w呢？（w向量决定投影方向）

如何确定ω呢? 注意到式(3.35)的分子和分母都是关于ω的二次项，因此式(3.35)的解与ω的长度无关，只与其方向有关。（why? 二次项的性质，若w是一个解，则对于任意常数α，αw也是式(3.35)的解.）

不失一般性，令，则式(3.35)等价于

由拉格朗日乘子法，上式等价于

其中λ是拉格朗日乘子。注意到的方向恒为，不妨令

代入式 (3.37) 即得

3. 将LDA推广到多分类

如何将LDA推广到多分类任务中？

假定存在N个类，且第i类示例数为,我们先定义"全局散度矩阵"

其中μ是所有示例的均值向量。将类内散度矩阵重定义为每个类别的散度矩阵之和，即：

其中，

例如：三类问题如下直观图所示：

显然，多分类 LDA 可以有多种实现方法：使用三者中的任何两个即可。

常见的一种实现是采用优化目标：

其中的tr()为矩阵的迹，一个n×n的对角矩阵A的主对角线（从左上方至右下方的对角线）上各个元素的总和被称为矩阵A的迹（或迹数），一般记作tr(A)。

最低0.47元/天解锁文章

博客等级

码龄12年

108
原创

1034
点赞

4962
收藏

859
粉丝

关注

私信

热门文章

分类专栏

最新评论

【机器学习】支持向量机SVM及实例应用
bo_hai: 楼主，你咋设置成vip可见呢？！你这水平，应该不差钱呀！
【翻译经典】Rapid Object Detection using aBoosted Cascade of Simple Features（人脸检测经典论文）
尧哥235: cvpr
三、生成RPM包
优快云-Ada助手: 不知道 CS入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/gml?utm_source=AI_act_gml
三、生成RPM包
大姨妈V: ###### 1.生成可执行文件、库文件 ######### cmake_minimum_required(VERSION 3.15) project(compute) set(target zls_bin) set(target2 libcompute.so) # 依赖的头文件 include_directories(${PROJECT_SOURCE_DIR}/include) file(GLOB include_file "${PROJECT_SOURCE_DIR}/include/*.h") # 文件搜索 file(GLOB SRC "${PROJECT_SOURCE_DIR}/src/*.c") # 设置生成库文件的路径(静态库\动态库都可行) set(LIBRARY_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/lib) # 设置生成可执行文件的路径 set(EXECUTABLE_OUTPUT_PATH ${PROJECT_SOURCE_DIR}/bin) set(CMAKE_VERBOSE_MAKEFILE ON) MESSAGE("PROJECT_NAME:${PROJECT_NAME}") MESSAGE("SRC:${SRC}") MESSAGE("LIBRARY_OUTPUT_PATH:${LIBRARY_OUTPUT_PATH}") MESSAGE("include_file:${include_file}") # 生成静态库文件 #add_library(${PROJECT_NAME} STATIC ${SRC}) # 生成动态库文件 add_library(${PROJECT_NAME} SHARED ${SRC}) # 生成可执行文件（方式三：链接动态库文件） ## 包含动态库路径 link_directories(${PROJECT_SOURCE_DIR}/lib) ## 生成可执行文件 add_executable(${target} main.c) ## 链接动态库文件(target 依赖动态库compute) target_link_libraries(${target} ${PROJECT_NAME})
三、生成RPM包
大姨妈V: # 将依赖的头文件安装到include目录 install(DIRECTORY ${PROJECT_SOURCE_DIR}/include DESTINATION include COMPONENT BComponent) #install(FILES ${include_file} DESTINATION include COMPONENT BComponent) include(CPack) # 添加一个名为 AComponent 的 component cpack_add_component(AComponent DISPLAY_NAME "A program" DESCRIPTION "The program for test" GROUP Aprogram) # 添加一个名为 BComponent 的 component cpack_add_component(BComponent DISPLAY_NAME "B program" DESCRIPTION "The program for test" GROUP Bprogram) # 添加一个名为 Aprogram 的 group, 这个名字会作为 rpm 包名字的一部分 cpack_add_component_group(Aprogram) # 添加一个名为 Bprogram 的 group cpack_add_component_group(Bprogram)

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。