李航 统计学习方法 第四章 朴素贝叶斯
基于贝叶斯定理和特征条件独立假设的分类方法.对于给定的训练数据集, 首先基于特征条件独立假设学习输入/输出的联合分布; 然后基于此模型, 对给定的输入x, 利用贝叶斯定理求出后验概率最大的输出y.
介绍朴素贝叶斯法, 包括朴素贝叶斯的学习和分类, 朴素贝叶斯法的参数估计算法.
基本方法
输入空间是n维向量的集合, 输出空间为类标记集合 Y = c 1 , c 2 , . . . , c K \mathcal{Y}={c_1, c_2,..., c_K} Y=c1,c2,...,cK, 输入为特征向量, 输出为类标记. X X X是定义在输入空间 X \mathcal{X} X上的随机向量, P ( X , Y ) P(X, Y) P(X,Y)是联合概率分布.
训练数据集由联合概率分布独立同分布产生.朴素贝叶斯法通过训练数据集学习联合概率分布, 也就是学习以西先验概率分布和条件概率分布. 先验概率分布 P ( Y = c k ) P(Y=c_k) P(Y=c