朴素贝叶斯与语言模型

最新推荐文章于 2025-03-10 22:01:05 发布

原创

最新推荐文章于 2025-03-10 22:01:05 发布 · 1.1k 阅读

4 ·

CC 4.0 BY-SA版权

文章标签：

#贝叶斯 #Naive Bayesian #语言模型 #language model #unigram

本文介绍了朴素贝叶斯分类器，包括贝叶斯分类器的基本概念、朴素贝叶斯的独立性假设以及计算方法。同时，文章探讨了语言模型，特别是N-gram模型，如一元、二元和三元模型，并讨论了朴素贝叶斯在文本分类中的应用，尤其是多项式朴素贝叶斯与一元语言模型的关联。

朴素贝叶斯（Naive Bayesian）与语言模型（Language Model）

前不久面试了美团，不出意外得失败了，面试中问了我关于朴素贝叶斯的知识，然而我没有回答好，现在仅以此文重新来看我之前认为简单的朴素贝叶斯，本文分为以下三个部分：

朴素贝叶斯介绍
语言模型
两者的联系
参考与致谢

一、朴素贝叶斯分类器介绍

1.1 贝叶斯分类器

我们很多时候都在做分类，其实就是一个判断P(Y=1|X)和P(Y=0|X)两个值谁大谁小的。而P(Y|X)又很容易让我们联想起贝叶斯公式：

P (Y | X) = P ( X | Y ) P ( Y ) P ( X )

$P(Y|X)=\dfrac{P(X|Y)P(Y)}{P(X)}$
在这个公式里面，P(X)和P(Y)叫做先验概率（prior），P(X|Y)叫做条件概率或者是似然（likelihood）,如果我们只是需要求出我们的待分类的东西属于哪一类而不是具体的概率值，为了方便计算，我们不需要去管P(X)，因为这个值在每一类里面都是一样的，所以上述公式在实际计算里面变成了这样：

P (Y | X) \propto P (X | Y) P (Y)

对于P(Y)（二分类里面就是P(Y=1)和P(Y=0)），根据大数定律，我们可以通过各类样本出现的频率进行估计，对于P(X|Y)，我们使用不同的方法估计就产生了不同的贝叶斯分类器，比如朴素贝叶斯分类器、半朴素贝叶斯分类器和贝叶斯网等。下面我们将着重讲解使用最广，最简单，效果还不错的朴素贝叶斯分类器。