分类算法与损失函数详解
在分类任务中,有多种典型的分类算法和用于衡量分类误差的损失函数。下面将详细介绍几种常见的分类算法及其原理。
1. 朴素贝叶斯分类器
朴素贝叶斯分类器属于概率分类,基于贝叶斯定理,但前提是特征具有强独立性。这种基于特征间强独立性的贝叶斯定理分类器是对定理条件的简化,因此被称为朴素贝叶斯。
给定输入空间中待分类的数据向量 $\mathbf{x} = (x_1, \ldots, x_n) \in \mathcal{X}$,输出空间是类别集合 $\mathcal{C} = {c_j | j = 1, \ldots, k}$,朴素贝叶斯分类就是在给定数据向量 $\mathbf{x}$ 的条件下,类别 $c_j$ 的条件概率 $P(c_j | \mathbf{x})$。
根据贝叶斯定理,有以下等式:
[P(c_j | \mathbf{x}) = \frac{P(\mathbf{x} | c_j)P(c_j)}{P(\mathbf{x})} = \frac{P(\mathbf{x} | c_j)P(c_j)}{\sum_{k} P(\mathbf{x} | c_j)P(c_j)}]
根据联合概率分布的链式法则,有:
[P(c_j, \mathbf{x}) = P(c_j, x_1, \ldots, x_n) = P(c_j) \prod_{i = 1}^{n} P(x_i | x_{i - 1}, \ldots, c_j)]
由于朴素贝叶斯中特征间具有强独立性,满足 $P(x_i | x_{i - 1}, \ldots, x_1, c_j) = P(x_i | c_j)$,所以:
超级会员免费看
订阅专栏 解锁全文
23万+

被折叠的 条评论
为什么被折叠?



