机器学习技术解析与应用探讨
1. 朴素贝叶斯分类器
朴素贝叶斯分类器是一种简单却在许多实际问题中非常有效的学习技术。它基于贝叶斯定理:
[P(h|D) = \frac{P(D|h) \times P(h)}{P(D)}]
该定理允许我们根据先验概率和逆条件概率 (P(D|h)) 来计算给定数据 (D) 时假设 (h) 的条件概率。在很多实际情况中,估计等式右边的三个概率比直接估计左边的概率更容易。
对于分类问题,我们通常从概率的角度出发,想要估计 (P(Class(X) = c_i|X)),其中 (X) 是待分类的对象,(Class(X)) 是其类别。我们会选择使估计的条件概率在所有可能类别中最大的类别 (c_i)。
朴素贝叶斯分类器使用贝叶斯定理来估计 (P(Class(X) = c|X)),并做出一个朴素假设来估计定理等式右边所需的逆条件概率。即:
[c_i = \arg\max_{c} P(Class(X) = c|X) = \arg\max_{c} \frac{P(X|Class(X) = c) \times P(Class(X) = c)}{P(X)}]
由于我们只关心哪个类别使上述分数最大,所以不需要知道 (P(X))。我们需要估计对象属于给定类别的先验概率和条件概率 (P(Class(X) = c|X))。先验概率可以通过对给定训练数据样本中各类别的简单频率计数来估计。
然而,估计 (P(Class(X) = c|X)) 通常不切实际,因为对于每个对象,训练样本中可能很少有甚至没有相关示例,导致条件概率的估计毫无用处。
因此,朴素贝叶斯分类器采用以下朴素假设:对象 (X) 有多个属性,对
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



