这次需要总结的是朴素贝叶斯算法,参考文章:
简介
朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。
贝叶斯定理是基于条件概率来计算的,条件概率是在已知事件B发生的前提下,求解事件A发生的概率,即 P(A|B)=P(AB)P(B) ,而贝叶斯定理则可以通过 P(A|B) 来求解 P(B|A) :
P(B|A)=P(A|B)P(B)P(A)
其中分母 P(A) 可以根据全概率公式分解为: P(A)=∑ni=1P(Bi)P(A|Bi)
而特征条件独立假设是指假设各个维度的特征 x1,x2,...,xn 互相独立,则条件概率可以转化为:
P(x|yk)=P(x1,x2,...,xn|yk)=∏i=1nP(xi|yk)
朴素贝叶斯分类器可表示为:
f(x)=argmaxykP(yk|x)=argma

本文详细介绍了朴素贝叶斯算法,包括其基于贝叶斯定理和特征条件独立假设的分类方法,以及参数估计的极大似然估计、贝叶斯估计/多项式模型、高斯模型和伯努利模型。朴素贝叶斯算法在小规模数据和多分类任务中有良好表现,但对输入数据的表达形式敏感。文中还提供了三种模型的代码实现。
最低0.47元/天 解锁文章
386

被折叠的 条评论
为什么被折叠?



