贝叶斯系列:(一)朴素贝叶斯分类器

本文介绍了朴素贝叶斯分类器的基本原理,包括贝叶斯定理和独立属性假设,并通过实例展示了如何计算各类别概率。文章讨论了在属性独立性不成立时的拉普拉斯修正,并提及了朴素贝叶斯在网络中的应用,如TAN和BAN网络。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

假设有N种可能的类别标记,记为:\[y=\left \{ c_{1},c_{2}...c_{N} \right \}\]现有一个样本x给定其各个属性的取值\[x_{i},i=1...d\],d为x所包含的属性的数目,若将x归为第c类的第k个属性,则有

                                      \[p(c|x)=\frac{p(c)p(x|c)}{p(x)}\](1)

然后根据计算每个属性的概率,取最大的概率值作为x属于的c类的值。朴素贝叶斯分类器的最基本最核心的思想是“假设已有样本中各个属性之间独立”,由此有:

\[p(c|x)=\frac{p(c)p(x|c)}{p(x)}=\frac{p(c)}{p(x)}\prod_{i=1}^{d}p(x_{i}|c)\]    (2)

又因为p(x)都是相同的,所以贝叶斯判定准则为

            \[h_{nb}(x)=arg\cdot max_{c\subseteq y}p(c)\prod_{i=1}^{d}p(x_{i}|c)\]\](3)

即判定准则取最大时x属于的类别 ci;

       估计类的先验概率P(c)的计算是基于训练集D的,并为每个属性估计条件概率\[p(x_{i}|c)\]。

       令 \[D_{c}\]表示训练集D种c类样本的集合,若有充足的独立同分布样本,则有

                                             \[p(c)= \frac{|Dc|}{|D|}\](4)

对于离散属性而言,令\[D_{c,x_{i}}\]表示\[D_{c}\]中

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值