分类（classification）

有梦想的雨

已于 2022-06-07 16:18:27 修改

阅读量444

点赞数

分类专栏：机器学习文章标签：分类机器学习算法

于 2022-06-05 23:08:50 首次发布

本文链接：https://blog.youkuaiyun.com/qq_41536160/article/details/125131201

版权

机器学习专栏收录该内容

21 篇文章

订阅专栏

这篇博客介绍了机器学习中的关键概念，包括损失函数，如0-1损失，用于衡量分类错误；贝叶斯分类器作为最优分类器，其在0-1损失下的分类误差最小；以及决策边界的概念，它定义了不同类别间的划分。此外，还提及了逻辑回归在分类问题中的应用，通过sigmoid函数限制预测值，并用极大似然估计来学习模型参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

损失函数

在分类中，使用一个 $C\times C$ 的损失矩阵 $L$ 来表达损失函数，其中， $C$ 指类别数。损失矩阵中的每个元素 $L_{kl}=L(k,l)$ 指将实际类别属于 $k$ ，但是将其分类到 $l$ 的损失。常用的损失函数为 $0 - 1$ 损失函，其中 $\displaystyle L_{kl}=\left\{ \begin{aligned} 1, && k\neq l \\ 0, && k=l \end{aligned} \right.$

其中，一个单位损失发生在错误分类的情况下，即 $\displaystyle L(Y,G(X))=I(Y\neq G(X))=\left\{ \begin{aligned} 1, && Y\neq G(X) \\ 0, && Y= G(X) \end{aligned} \right.$

而分类器 $G$ 的预测损失/错误率是 $Err(G)=\mathrm E[L(Y,G(X))]=Average\{L(y^{(i)},G(\mathbf x^{(i)}))，\forall (y^{(i)},\mathbf x^{(i)})\}$ 。最终目标是找到一个使得预测错误率最小的分类器。

贝叶斯分类器（Bayes classifier）

当给定 $X=\mathbf x$ 时， $Y = c$ 的条件概率为 $\displaystyle p_c(\mathbf x)=P(Y=c|X=\mathbf x)$ ，其中 $c=1,\cdots,C$ 。

将样本 $\mathbf x$ 分类到 $c$ 的条件是： $p_c(\mathbf x)\ge p_j(\mathbf x), \forall j=1,\cdots,C$ 。

贝叶斯分类器是 0-1损失下的最优分类器，相较于其他分类器有着最小的分类误差。

决策边界

考虑类别 $k$ 和 $j$ ，集合 $\{\mathbf x:p_k(\mathbf x)=p_j(\mathbf x)\}$ 则为类别 $k$ 和 $j$ 之间的 决策边界(decision boundary)。
在这里插入图片描述
给定训练集 $\{(y^{(i)},\mathbf x^{(i)}),i=1,\cdots,n\}$ ，分类器 $G$ 的 经验误差(empirical error) 为 $\displaystyle \overline{err}(G)=\frac{1}{n}\sum_iI(y^{(i)}\neq G(\mathbf x^{(i)}))$