朴素贝叶斯
朴素贝叶斯是概率框架下实验决策的方法,是基于贝叶斯定理与特征条件独立假设的分类方法。

1、贝叶斯定理:
由图一可知A、X同时发生的概率为:P(A)∗P(X|A)P(A)∗P(X|A);
由图二可知A、X同时发生的概率为:P(X)∗P(A|X)P(X)∗P(A|X);
所以有:
P(A)∗P(X|A)=P(X)∗P(A|X)P(A)∗P(X|A)=P(X)∗P(A|X)
可转化为:
P(A|X)=P(X|A)∗P(A)P(X)P(A|X)=P(X|A)∗P(A)P(X)
2、朴素贝叶斯定理:
朴素贝叶斯认为各特征之间相互独立,X,Y有可能同时出现,所以有:
P(X,Y|A)=P(X|A)∗P(Y|A)P(X,Y|A)=P(X|A)∗P(Y|A)
所以朴素贝叶斯公式:
P(c|x)=P(c)∗P(x|c)P(x)=P(c)P(x)∗∏i=1dP(xi|c)P(c|x)=P(c)∗P(x|c)P(x)=P(c)P(x)∗∏i=1dP(xi|c)
对于连续属性有:
P(xi|c)=12π‾‾‾√∗σc,i∗e(−(xi−μc,i)22σ2c,i)P(xi|c)=12π∗σc,i∗e(−(xi−μc,i)22σc,i2)
其中σc,i、σ2c,iσc,i、σc,i2分别是第c类样本在第i个属性上取值的均值和方差。
3、sklearn中的朴素贝叶斯
from sklearn.naive_bayes import MultinomialNB
naive_bayes = MultinomialNB()
naive_bayes.fit(training_data,y_train)