朴素贝叶斯(Naive Bayes)

本文深入探讨了贝叶斯公式在机器学习领域的应用,重点介绍了朴素贝叶斯算法的基本原理、特点及实际应用案例。通过多变量Bernoulli模型的分析,解释了如何利用独立性假设简化计算过程,并在分类任务中实现高效快速的预测。同时,讨论了朴素贝叶斯方法的优缺点,特别强调其在处理独立特征时不敏感的优势,以及如何在不同类型数据集上灵活应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,我们有贝叶斯公式(Bayes theorem):


然后,给出我们的假设:我们的输入x中的数据是两两条件独立的,因此:

现在我们以一个多变量的Bernoulli模型为例:

对给定的i,对每一个j,相互独立,有



数据的联合似然:


使其取得最大值,解得:


既然已经得到了参数,当我们有一个新的x,我们就可以计算:


实践证明,贝叶斯是快的,空间效率高,我们可以把所有的概率存入到数据库中的表里:


然而,贝叶斯方法对不相关的特征不敏感,比如说,你想基于眼睛的颜色而对性别进行分类时:


朴素贝叶斯的优缺点:

优点:

1.      对数据的训练快,分类也快

2.      对不相关的数据不敏感

3.      处理实数,也可以处理离散的数据

4.      处理流数据的性能不错

缺点:

         假设特征相互独立(事实却远非如此)

朴素贝叶斯可以处理很多模型:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值