一、朴素贝叶斯是什么,怎么用?
贝叶斯定理:朴素贝叶斯定理体现了后验概率 P(y|x)P(y|x) 、先验概率 P(y)P(y) 、条件概率 P(x|y)P(x|y) 之间的关系:
P(y|x)=P(x,y)P(x)=P(x|y)⋅P(y)P(x)P(y|x)=P(x,y)P(x)=P(x|y)⋅P(y)P(x)
朴素贝叶斯之所以叫“朴素”就是因为它假设输入的不同特征之间是独立的。假设所有相关概率已知,基于这些概率来选择最优的类别,是朴素贝叶斯解决的一种典型问题。下面举一个例子。
X/Y | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
X(1)X(1) | 1 | 1 | 1 | 1 | 1 | 2 | 2 | 2 | 2 | 2 |
X(2)X(2) | S | M | M | S | S | S | M | M | L | L |
YY | -1 | -1 | 1 | 1 | -1 | -1 | -1 | 1 | 1 | 1 |
现在给定一个输入x = (2, S),求对应的 y
我们注意到这个问题其实就是求后验概率的问题,让我们尝试使用贝叶斯定理来解决
- 第一步,求先验概率 P(y=1)=0.5,P(y=−1)=0.5P(y=1)=0.5,P(y=−1)=0.5
第二步,求条件概率 P(x|y)P(x|y)
P(