朴素贝叶斯基于的是贝叶斯定理与特征条件独立假设的分类方法。
==朴素贝叶斯法对条件概率分布作了条件独立性的假设==
P(X=x|Y=ck)=P(X(1)=x(1),···,X(n)=x(n)|Y=ck)=∏j=1nP(X(j)=x(j)|Y=ck)P(X=x|Y=ck)=P(X(1)=x(1),···,X(n)=x(n)|Y=ck)=∏j=1nP(X(j)=x(j)|Y=ck)
上式的意思是说假设X代表好瓜,属性x^(1)^ 为色泽,x^(2)^ 为形状,等,他们与彼此不产生任何关系。
朴素贝叶斯进行分类时,对给定的输入x,通过学习到的模型计算后验概率分布P(Y=ck|X=x)P(Y=ck|X=x),将后验概率最大的类作为xx类的输出,后验概率计算根据贝叶斯定理进行:
则将(1)带入(2),有
P(Y=xk|X=x)=P(Y=ck)∏nj=1P(X(j)=x(j)|Y=ck)∑kP(Y=ck)∏nj=1P(X(j)=x(j)|Y=ck)P(Y=xk|X=x)=P(Y=ck)∏j=1nP(X(j)=x(j)|Y=ck)∑kP(Y=ck)∏j=1nP(X(j)=x(j)|Y=ck)
这就是朴素贝叶斯的基本公式。
则朴素贝叶斯分类器可表示为
y=f(x)=argmaxckP(Y=ck)∏nj=1P(X(j)=x(j)|Y=ck)∑kP(Y=ck)∏nj=1P(X(j)=x(j)|Y=ck)y=f(x)=argmaxckP(Y=ck)∏j=1nP(X(j)=x(j)|Y=ck)∑kP(Y=ck)∏j=1nP(X(j)=x(j)|Y=ck)
其中,分母对所有分分类c~k~来说都是相同的,故
y=f(x)=argmaxckP(Y=ck)∏j=1nP(X(j)=x(j)|Y=ck)y=f(x)=argmaxckP(Y=ck)∏j=1nP(X(j)=x(j)|Y=ck)
【未完待续】