毕设的开题初步定在了情感分析方面,于是自己开始查看各种文献,本想等到模型设计完毕在进行coding的,但是按捺不住心中那想coding的心情,就快速的实现了个朴素贝叶斯的分类器。算法比较简单,本想从处理数据到训练到最终代码用一晚上搞定的,结果在实现朴素贝叶斯的过程中还是遇到了一些自己没有发现的问题,耽搁了一点时间,现在将朴素贝叶斯整理整理。
朴素贝叶斯,naive bayes,是个生成式模型。如果读者不明白什么是生成式模型的话,可以google下,这里我也借鉴一个我认为非常棒的解释来小介绍下。我们对分类器进行建模,主要就是,这里的
就是我们要训练的参数了。通过训练参数,得到我们的模型。通过新的特征x的输入,我们就得到了我们的判别结果,这种模型叫做判别式模型!比如说要确定一只羊是山羊还绵羊, 用判别模型的方法先从历史数据中学习到模型,然后通过提取这只羊的特征来预测出是山羊概率,是绵羊的概率。换一种思路我 们可以 根据山羊的特征首先学习出一个模型,然后根据绵羊的特征学习一个绵羊的模型。 然后从这只羊中提取特征, 放到山羊模型看概率是多少再放到绵羊模型中看看概率是多少,哪个大就是哪个。这中另外的一种思路就是生成模型了。