文章目录
一. 概率基础
概率定义为一件事情发生的可能性
1. 联合概率和条件概率
2. 朴素贝叶斯-贝叶斯公式
3. 拉普拉斯平滑
如果得到的概率为零,可用拉普拉斯平滑系数解决
二. 朴素贝叶斯算法案例
1. sklearn朴素贝叶斯实现API
sklearn.baive_bayes.MultinomialNB(alpha)
alpha: 拉普拉斯平滑系数
2. 朴素贝叶斯案例流程
- 加载20类新闻数据,并进行分割
- 生成文章特征词
- 朴素贝叶斯estimator流程进行预估
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
def naviebayes():
'''朴素贝叶斯进行文本分类'''
news = fetch_20newsgroups(subset='all')
##进行数据分割