复习机器学习算法:贝叶斯分类器

本文深入探讨了朴素贝叶斯算法的核心概念,包括其极大后验假设原理及计算过程。阐述了算法的优点,如适用于大规模数据集、多分类任务及增量式训练,并讨论了独立性假设对算法性能的影响。同时,介绍了处理特征间相关性问题的方法,如m-估计和贝叶斯结合。最后,强调了算法在实际应用中的局限性和改进方向。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

   

    

朴素贝叶斯算法是寻找一个极大后验假设(MAP),即候选假设的最大后验概率。

 

如下:

在朴素贝叶斯分类器中,假设样本特征之间是独立的,则有:


计算每个假设的后验概率,选出最大的概率,对应的类别就是样本的分类结果。

 

优缺点:

对小规模的数据表现很好,适合多分类任务,适合增量式训练。当时,需要样本的特征之间独立性较高,不能有太多的相关性。对输入数据的表达形式很敏感。

 

还有,当样本中某个特征在该类别中出现次数为0,即P(ai |vj)=0, 导致上式的分子全部为0. 这个时候需要使用m-估计和贝叶斯结合,如下:

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值