模式识别（三）：线性判别函数

最新推荐文章于 2024-07-05 21:05:16 发布

云端暮雪

最新推荐文章于 2024-07-05 21:05:16 发布

阅读量9.8k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：模式识别与机器学习文章标签：模式识别线性判别函数广义线性判别函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/yunduanmuxue/article/details/20136319

模式识别与机器学习专栏收录该内容

9 篇文章

订阅专栏

本文介绍了基于判别函数的分类器中的线性判别函数法，并详细解释了线性判别函数的数学形式及其应用。同时探讨了如何将非线性判别函数通过变换转化为线性判别函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本系列文章由孙旭编辑，转载请注明出处

http://blog.youkuaiyun.com/longyindiyi/article/details/20068781

多谢合作！

如果您在阅读文章过程中发现有表述错误的地方，还请指正。

上一节我们讲到，分类器的设计有两种思路：基于判别函数的分类器和基于距离的分类器。本节我们开始介绍基于判别函数的分类器中的线性判别函数法。

判别函数法是对不同模式进行分类有很多方法中应用比较广的一种。

所谓判别函数就是指直接用来对模式样本进行分类的准则函数。

如果判别函数可以用线性关系进行描述的话，就称之为线性判别函数，否则称为非线性判别函数。

上图给了我们一个直观的理解，第一个图中的蓝色直线代表一个线性分类器，而第二个图中的绿色曲线代表一个非线性分类器。

下面我们给出线性判别函数的数学形式。

d 维空间中的线性判别函数的一般形式：

$g(\mathbf{x}) = \mathbf{w}^T \mathbf{x} + w_0$ （1）

这里我们用加粗的字符表示向量（未加特殊说明情况下向量均指的是列向量）， $\mathbf{x}$ 是样本向量， $\mathbf{w}$ 是权值向量。 $w_0$ 是一个常数（阈值），即

$\begin{aligned} &\mathbf{x} &= [&x_1, &x_2, &..., &x_d]^T\\ &\mathbf{w} &= [&w_1, &w_2, &..., &w_d]^T \end{aligned}$

有时候，为了便于程序实现，也将公式（1）表示为

$g(\mathbf{x^*})=\mathbf{w^{*T}}\mathbf{x^*}$

这里

$\begin{aligned} &\mathbf{x^*} &= [&1, &x_1, &&x_2, &&..., &&x_d]^T\\ &\mathbf{w^*} &= [&w_0, &w_1, &&w_2, &&..., &&w_d]^T \end{aligned}$

对于两类问题而言，有

$\begin{cases} \begin{aligned} g(\mathbf{x^*})$

其中 $\omega_i$ 表示第 $i$ 类。若出现 $g(\mathbf{x^*}) = 0$ 则认为判别函数失效，拒绝分类。不难看出，由上面的 $g(\mathbf{x^*}) = 0$ 确定的决策面为超平面，而 $\mathbf{w}$ 是该决策面的法向量。

对这类分类器的学习过程可以表述如下：

获取训练样本集, 即一组具有类别标志的样本集；
确定一个准则函数 $J(\mathbf{x^*, w^*})$ : $J$ 的值反映分类器的性能,它的极值解则对应于最好的分类决策，例如 $J$ 为分类误差；
最优化方法求出准则函数的极值解 $\widetilde{\mathbf{w^*}}$ ；
对未知样本y, 只要计算 $g(\mathbf{y})$ ，然后根据决策规则判定 $\mathbf{y}$ 所属类别。

上述过程可以用流程图表示如下：

线性判别函数的优点是简单，但是它不能用来处理一些稍微复杂点的问题，比如，下面这种情况。

设计一个一维分类器，使其功能为（假设 a < b）：

当 x < a 或者 x > b 时，则决策 x 属于第一类；
当 a < x < b 时，则决策 x 属于第二类。

显然，如果判别函数取为给 g(x) = (x - a)(x - b) 可以满足要求，但这时 g(x) 却并非关于 x 的线性函数，关于线性函数的优化方法将不能直接应用在这个函数上。这时，我们该怎么办呢？

答案是使 g(x) 线性化。那么，怎么线性化呢？换元法相信大家都学过，这里用到的就是换元法，只不过我们换了个叫法——把换元后得到的新的判别函数称为广义线性判别函数，权向量称为广义权向量。具体过程如下：

展开判别函数为 $g(x) = x^2 - (a + b)x + ab = u_2x^2 + u_1x + u_0$ , 令

$\mathbf{y} = \begin{bmatrix} y_0\\ y_1\\ y_2 \end{bmatrix}= \begin{bmatrix} 1\\ x\\ x^2 \end{bmatrix}$

和

$\mathbf{w} = \begin{bmatrix} w_0\\ w_1\\ w_2 \end{bmatrix}= \begin{bmatrix} u_0\\ u_1\\ u_2 \end{bmatrix}$

这时，有

$g(x) = g(\mathbf{y}) = \mathbf{w^Ty}$

此时，判别函数变成了关于 $\mathbf{y}$ 的线性函数。学习过程就可以按前面介绍的方法进行了。

按照上述原理，任何非线性函数 g(x) 用级数展开成高次多项式后，都可转化成线性判别函数来处理，但是经过变换后维数大大增加了，这将导致计算量大大增加，甚至导致维数灾难。

由此可见，增加维数有时可能不是好办法，那么，降低维数呢？

这就引出了线性判别分析中一个非常重要的算法——Fisher 线性分析，我们将在下篇文章里进行介绍。

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。