1.理解朴素贝叶斯
1)基本概念
-
依据概率原则进行分类。如天气预测概率。
-
朴素贝叶斯(Naive Bayes, NB)适合场景:为估计一个结果的概率,从众多属性中提取的信息应该被同时考虑。
-
很多算法忽略了弱影响的特征(若有大量弱影响的特征,它们组合在一起的影响可能会很大),但NB算法利用了所有可以获得的证据来修正预测。
-
贝叶斯方法的基本概念:事件,试验,概率,联合概率,独立事件,相关事件(建立预测模型的基础),条件概率,先验概率,似然概率,边际似然概率,后验概率,频率表
-
条件概率公式(事件B已经发生的条件下,事件A发生的概率):
image.png
-
后验概率(如商业垃圾邮件过滤器:判断viagra是垃圾邮件spam的概率):