↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
Datawhale干货
作者:小雨姑娘,康涅狄格大学,Datawhale成员
这几天看了看SVM的推导,看的是真的头疼,那就先梳理基础的线性判别分析模型,加深对SVM的理解。
线性判别分析是一种线性的分类模型。
线性分类模型是指采用直线(或超平面)将样本直接划开的模型,其形式可以表示成 的形式,划分平面可以表示成 。这里可以看出,线性分类模型对于样本的拟合并不一定是线性的,例如逻辑回归(外面套了一层sigmod函数)和感知机(外面套了一层激活函数)。
线性判别分析的基本思想是把所有样本投影到一条直线上,使样本在这条直线上最容易分类。
设直线的方向向量为 ,则样本 在直线上的投影为 ,如图:
我们的目标是使两类样本的中心点在线上的投影距离大(两类样本区分度高),同时使每一类样本在线上投影的离散程度尽可能小(类内样本区分度低)。
令 ,

本文介绍了线性判别分析(LDA)的基础知识,它是一种线性分类模型,旨在通过找到最佳投影直线使样本易于分类。LDA的目标是最大化类别间的投影距离并最小化类别内的投影离散程度。文章还解释了协方差的概念及其在LDA中的作用,并提供了优化问题的转换和解决方案。最后,给出了Python实现LDA分类问题的例子。
最低0.47元/天 解锁文章
787

被折叠的 条评论
为什么被折叠?



