根据贝叶斯定理,对一个分类问题,给定样本特征x,样本属于类别y的概率是
p(y|x)=p(x|y)p(y)p(x)
朴素贝叶斯假设各特征独立同分布,判断属于哪一类别只用比较概率大小,我们可以假设p(x)相同(即所有类别等可能发生),p(y)相同(均匀分布),所以只需要比较p(x|y)即可。
避免p(x|y)=0,我们用到:
拉普拉斯平滑
(nk+1)/(n+类别数)
其中nk为出现的次数,n为总次数。
根据贝叶斯定理,对一个分类问题,给定样本特征x,样本属于类别y的概率是
朴素贝叶斯假设各特征独立同分布,判断属于哪一类别只用比较概率大小,我们可以假设p(x)相同(即所有类别等可能发生),p(y)相同(均匀分布),所以只需要比较p(x|y)即可。
避免p(x|y)=0,我们用到:
(nk+1)/(n+类别数)
其中nk为出现的次数,n为总次数。