【朴素贝叶斯】Part1——朴素贝叶斯基本原理

本文介绍了概率论基本知识,包括条件概率、全概率公式和贝叶斯定理。重点讲解了朴素贝叶斯法的学习与分类原理,包括基本方法、后验概率最大化及其条件独立性假设。此外,还讨论了朴素贝叶斯法的参数估计,如极大似然估计和贝叶斯估计。文章最后提到了朴素贝叶斯在实际应用中的概率公式推导和Python实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 概率论基本知识回顾

  • (1)条件概率:设A,B是两个事件,且P(A)>0,称 P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A) = \frac {P(AB)}{P(A)} P(BA)=P(A)P(AB) 为在事件A发生的条件下事件B发生的概率。

  • (2)乘法定理:设P(A)>0,称 P ( A B ) = P ( B ∣ A ) P ( A ) P(AB) = {P(B|A)}{P(A)} P(AB)=P(BA)P(A) 为事件A,B同时发生的概率等于事件A发生的概率与事件A发生的条件下事件B发生的概率的乘积。

  • (3)全概率公式:设B1,B2,…,Bn是样本空间S的一个全划分,则:
    P ( A ) = P ( A ∩ S ) = P ( A ∩ ( B 1 ∪ B 2 ∪ . . . ∪ B n ) ) = P ( A ∩ B 1 ) + P ( A ∩ B 2 ) + . . . + P ( A ∩ B n ) = P ( A ∣ B 1 ) P ( B 1 ) + P ( A ∣ B 2 ) P ( B 2 ) + . . . + P ( A ∣ B n ) P ( B n ) P(A)=P(A\cap S) \\ =P(A\cap(B1\cup B2\cup ...\cup Bn)) \\ =P(A\cap B1)+P(A\cap B2)+...+P(A\cap Bn) \\ =P(A|B1)P(B1)+P(A|B2)P(B2)+...+P(A|Bn)P(Bn) P(A)=P(AS)=P(A(B1B2...Bn))=P(AB1)+P(AB2)+...+P(ABn)=P(AB1)P(B1)+P(AB2)P(B2)+...+P(ABn)P(Bn)

  • (4)贝叶斯定理:根据条件概率的定义,事件 A 发生的条件下事件 B 发生的概率、事件 B 发生的条件下事件 A 发生的概率分别为:
    P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A) = \frac {P(AB)}{P(A)} P(BA)=P(A)P(AB)

    P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B) = \frac {P(AB)}{P(B)} P(AB)=P(B)P(AB)

    结合这两个方程式,我们可以得到:
    P ( B ∣ A ) P ( A ) = P ( A B ) = P ( A ∣ B ) P ( B ) {P(B|A)}{P(A)} = P(AB) = {P(A|B)}{P(B)} P(BA)P(A)=P(AB)=P(AB)P(B)

    上式两边同除以 P(B),若P(B)>0,我们可以得到贝叶斯定理:
    P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B) = \frac { {P(B|A)}{P(A)}}{P(B)} P(AB)=P(B)P(BA)P(A)

P(A)是 A 的先验概率,之所以称为“先验”是因为它不考虑任何 B 方面的因素。
P(A|B)是已知 B 发生后 A 的条件概率,也由于得自 B 的取值而被称作 A 的后验概率。
P(B|A)是已知 A 发生后 B 的条件概率,也由于得自 A 的取值而被称作 B 的后验概率。
P(B)是 B 的先验概率,也作标淮化常量(normalizing constant)。
贝叶斯定理可表述为:
后验概率 = (相似度 * 先验概率)/标淮化常量

2. 朴素贝叶斯法的学习与分类原理

2.1 基本方法

  • 输入: 训练数据集 T = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N ) } T= \{(x_{1},y_{1}),(x_{2},y_{2}),...,(x_{N},y_{N})\} T={ (x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值