贝叶斯分类器:概率、连续属性与高斯函数的应用
在数据分析和机器学习领域,贝叶斯分类器是一种强大的工具,它基于贝叶斯公式进行分类决策。下面将深入探讨贝叶斯分类器的相关知识,包括离散属性的分类、稀有事件概率估计、连续属性的处理以及高斯函数在概率密度函数近似中的应用。
离散属性的贝叶斯分类
假设有一个待分类的对象 $x = [shape=square, crust - size=thick, crust - shade=gray, filling - size=thin, filling - shade=white]$,存在两个类别:正类(pos)和负类(neg)。在训练集中,这两个类别的样本数量相同,即 $P(pos) = P(neg) = 0.5$。
通过计算每个类别的贝叶斯公式分子来确定对象的类别。具体步骤如下:
1. 计算每个属性在不同类别下的条件概率,例如:
- $P(shape=square|pos) = 1/6$
- $P(shape=square|neg) = 2/6$
- ……
2. 计算 $P(x|pos)$ 和 $P(x|neg)$:
- $P(x|pos) = \prod_{i = 1}^{n}P(x_i|pos) = \frac{1}{6} \times \frac{5}{6} \times \frac{1}{6} \times \frac{3}{6} \times \frac{1}{6} = \frac{15}{6^5}$
- $P(x|neg) = \prod_{i = 1}^{n}P(x_i|neg) = \frac{2}{6} \times \frac{5}{6} \times \f
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



