贝叶斯公式
首先我们从实例来了解贝叶斯公式。某个医院早上收了六个门诊病人,如下表:
| 症状 | 职业 | 疾病 |
|---|---|---|
| 打喷嚏 | 护士 | 感冒 |
| 打喷嚏 | 农夫 | 过敏 |
| 头疼 | 建筑工人 | 脑震荡 |
| 头疼 | 建筑工人 | 感冒 |
| 打喷嚏 | 教师 | 感冒 |
| 头疼 | 教师 | 脑震荡 |
现在又来了第七个病人,是一个打喷嚏的建筑工人。请问他患上感冒的概率有多大?
p
(
感
冒
∣
打
喷
嚏
,
建
筑
工
人
)
=
p
(
打
喷
嚏
∣
感
冒
)
×
p
(
建
筑
工
人
∣
感
冒
)
×
p
(
感
冒
)
p
(
打
喷
嚏
)
×
p
(
建
筑
工
人
)
=
2
3
×
1
3
×
1
2
1
2
×
1
3
=
2
3
p(感冒|打喷嚏,建筑工人)=\frac{p(打喷嚏|感冒)\times p(建筑工人|感冒)\times p(感冒)}{p(打喷嚏)\times p(建筑工人)}\\ \ \\=\frac{\frac{2}{3}\times\frac{1}{3}\times\frac{1}{2}}{\frac{1}{2}\times\frac{1}{3}}=\frac{2}{3}
p(感冒∣打喷嚏,建筑工人)=p(打喷嚏)×p(建筑工人)p(打喷嚏∣感冒)×p(建筑工人∣感冒)×p(感冒) =21×3132×31×21=32
因此贝叶斯公式用类别和特征表示为:
p
(
类
别
∣
特
征
)
=
p
(
特
征
∣
类
别
)
×
p
(
类
别
)
p
(
特
征
)
p(类别|特征)=\frac{p(特征|类别)\times p(类别)}{p(特征)}
p(类别∣特征)=p(特征)p(特征∣类别)×p(类别)
- 朴素贝叶斯成立的条件是在类别确定的条件下各个特征之间相互独立,也就是在类别确定的情况下,特征
x
1
x_1
x1的任意取值对特征
x
2
x_2
x2没有影响。因此也就使得下式成立:
p ( x ∣ l a b l e ) = p ( x 1 ∣ l a b e l ) × p ( x 2 ∣ l a b e l ) × ⋯ × p ( x n ∣ l a b e l ) p(x|lable)=p(x_1|label)\times p(x_2|label)\times \cdots \times p(x_n|label) p(x∣lable)=p(x1∣label)×p(x2∣label)×⋯×p(xn∣label) - 在实际应用中,我们需要对数据进行统计得出 p ( x 1 ∣ l a b e l ) p(x_1|label) p(x1∣label),即计算在类别确定的情况下,特征 x 1 x_1 x1出现的次数占该类别样本总量的比值。但当 p ( x i ∣ l a b e l ) p(x_i|label) p(xi∣label)为0时,会影响后验概率的计算结果,使分类产生偏差。因此需要引入拉普拉斯平滑。
- 朴素贝叶斯优点是逻辑简单,易于实现。缺点是朴素贝叶斯要求属性间相互独立。当属性间相关性越大,其分类效果也就越差。
本文介绍了朴素贝叶斯算法的基础,通过一个医院病人的例子解释了贝叶斯公式,并讨论了在类别确定条件下特征间的独立性假设。文章还提到了朴素贝叶斯的优点和缺点,如逻辑简单、易于实现,但要求属性间相互独立。当属性相关性较大时,分类效果可能下降,并提到在处理0概率问题时采用的拉普拉斯平滑技术。
1977

被折叠的 条评论
为什么被折叠?



