贝叶斯分类

最新推荐文章于 2018-10-22 11:59:32 发布

原创最新推荐文章于 2018-10-22 11:59:32 发布 · 4.5k 阅读

4 ·

CC 4.0 BY-SA版权

机器学习专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍了贝叶斯分类的基本原理，包括先验知识、自然函数和后验概率的计算过程。讨论了朴素贝叶斯分类的概念，以及如何处理特征属性相互独立性假设导致的模型偏差和概率估计的准确性问题。此外，文章还提供了贝叶斯分类在文本分类中的伪代码实现，并分析了其效能。最后，阐述了贝叶斯分类在实际应用中的局限性和改进方向。

基本原理

贝叶斯分类是基于贝叶斯公式的一种分类方法，它是通过先验知识和似然函数来估计后验概率。其公式如下：P(H | X) = P(X | H)*P(H) / P(X)，其中H是假设，在分类中也就是判定的某种类别，X是证据向量，在分类中也就是n维的特征向量值，一般写作X=(x1, x2, ..., xn)。

因此对于一个给定的X，我们可以通过贝叶斯公式针对每种假设Hi，计算后验概率P(Hi | X)，并将X归类为P(Hi | X)值最大的假设Hi。因此对于任意一个测试样本X，我们需要计算所有可能的假设Hi在X下的后验概率值。计算P(H | X)，我们需要计算三个量：

先验概率P(H)：先验概率P(H)是对每种假设分布的先验知识，在没有专家知识的情况下，我们一般采用训练样本来计算先验概率。

先验概率P(X)：P(X)是特征向量X分布的先验概率，在没有更多专家知识的情况下，我们可以假设它为1。其实无论P(X)值为多少，都不会影响对最后结果的评判。因为P(X)是计算所有后验概率的共同分母，其值不影响后验概率大小的比较。

文本分类伪代码

void Bayes_classifier()
{
	分词(以词为特征);
	特征选择(假设选取2000个特征词);
	foreach(c in C) { // C为类别的集合
		计算P(c); // |S(c)| / |S|
foreach(f in F) { // F为选取的特征的集合
			计算P(f | c); // Num(f in S(c)) / Num(f in S)，注意零频问题
}
}
foreach(t in T) { // T为测试集
	分词;
	构造特征向量X;
	foreach(c in C) {
		计算P(X | c)*P(c);
}
将t归类为P(X|c)*P(c)值最大的类别c;
	}
}