机器学习算法笔记之4:贝叶斯分类器

本文深入介绍了贝叶斯分类器的原理,包括贝叶斯定理的应用,类先验概率和类条件概率的估计。讨论了朴素贝叶斯分类器的假设,并解释了如何进行拉普拉斯修正以避免概率估值为零的问题。最后,通过Sklearn库展示了GaussianNB、MultinomialNB和BernoulliNB三种不同类型的贝叶斯分类器的实现和实验结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、贝叶斯分类器详解

贝叶斯分类器是一类分类算法的总称,这类算法均以贝叶斯定理为理论基础。贝叶斯分类器的分类原理是通过先验概率,利用贝叶斯公式计算出后验概率,选择最大后验概率所对应的分类结果。

贝叶斯准则

其中,P(c)是先验概率,P(x|c)样本x相对于;类标记c的类条件概率,或称为似然(likelihood);P(x)是用于归一化的证据因子。对于给定样本x,证据因子与类标记无关,则估计P(c|x)可转换为基于训练数据D来估计鲜艳P(c)和似然P(x|c)。类先验概率P(c)可通过各类样本出现的频率来进行估计。对于类条件概率P(x|c),一种常用策略是先假定其具有某种确定的概率分布形式,再基于训练样本对概率分布的参数进行估计。

对于朴素贝叶斯分类器,朴素(naive)的含义是各个特征属性之间是相互独立的。例如,在计算p(w|ci)时,我们将特征向量w展开为独立子特征,则转化为,这里我们有假设所有特征都独立,即可以使用以下公式来计算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值