贝叶斯机器学习系列:
贝叶斯②——贝叶斯3种分类模型及Sklearn使用(高斯&多项式&伯努利)
贝叶斯③——Python实现贝叶斯文本分类(伯努利&多项式模型对比)
贝叶斯④——Sklean新闻分类(TF-IDF)
贝叶斯⑤——搜狗新闻分类实战(jieba + TF-IDF + 贝叶斯)
贝叶斯⑥——银行借贷模型(贝叶斯与决策树对比)
贝叶斯分类是一类以贝叶斯定理为基础的分类算法的总称,其中基于特征之间相互独立的朴素贝叶斯是最简单,但效果却非常好的一种分类算法。本文整理了贝叶斯算法的基本原理,希望能够对大家有所帮助~~
一、贝叶斯定理
设想一个问题:班里有30个男生,20个女生,有3个男生留长头发,有15个女生留长头发,现在有一个人留长头发,是男生的可能性有大?
解答过程:
P(长发)=(3+15)/(30+20)=18/50=9/25
P(男生)=30/(30+20)=3/5
P(女生)=20/(20+30)=2/5
P(长发|男生)=3/30 = 1/10
P(长发|女生)=15/20=3/4
P(男生|长发) = P(长发|男生)× P(男生)/P(长发) =(1/10×3/5) /(9/25