目录
一、算法概述
1.1算法简介
对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。朴素贝叶斯分类器是一类基于贝叶斯定理的简单概率分类算法,它是一种有监督学习算法,常用于文本分类、垃圾邮件过滤、情感分析等问题。朴素贝叶斯分类器假设特征之间相互独立(条件独立性假设),这是“朴素”(Naive)之处,因为在现实情况中,特征之间可能存在相关性。
1.2先验概率、后验概率和条件概率
P(cj)代表还没有训练模型之前,根据历史数据/经验估算cj 拥有的初始概率。P(cj)常被称为cj的先验概率 , 它反映了cj的概率分布,该分布独立于样本。通常可以用样例中属于cj的样例数|cj|比上总样例数|D|来近似,即:
已知两个独立事件A和B,事件B发生的前提下,事件A发生的概率可以表示为P(A|B),即:
其中,联合概率表示两个事件共同发生的概率,例事件A与事件B同时发生,表示为P(A,B)或P(AB)。
根据条件概率和全概率公式,可以得到贝叶斯公式如下:

最低0.47元/天 解锁文章
1380

被折叠的 条评论
为什么被折叠?



