一、算法
假设一个文本数据集T={(x1,y1),(x2,y2),...(xN,yN)},其中xi表示第i个数据,
现在给定一个样本x′i=(x′11,x′22,...,x′nn),算出x′i的类别。
计算方法:
1、对已有数据集统计各个分类的概率,即先验概率
2、计算每一个分类里面,对应的xji的概率,即条件概率
3、计算给定样本x′i=(x′11,x′22,...,x′nn)在每一个分类的概率,
4、确定x′i=(x′11,x′22,...,x′nn)属于哪一类,即判断其在哪一个类的概率最大
二、贝叶斯推理
1、先验概率分布:
2、条件概率分布
3、后验概率:
四、例题