机器学习之朴素贝叶斯

贝叶斯定理

几个定义

  1. 先验概率
            先验概率是指根据以往经验和分析得到的概率。在事件发生前,我们根据以往经验所预测的概率。
    实例:抛一枚硬币,在抛之前,我们预测P(正面在上) = P(反面在上) = 0.5,这里P(正面在上)P(反面在上) 两个概率都属于先验概率。
  2. 联合概率
            联合概率是指在多元的概率分布中多个随机变量分别满足各自条件的概率。A条件满足与B条件满足的联合概率表示为P(A∩B)或者P(A,B)。
  3. 后验概率
            事情已经发生了,事情发生可能由很多因素导致,判断一个因素对此事件发生造成影响的大小的概率。后验概率属于条件概率。
    表示形式:P(A|B),其中A为因素,B为事件。
  4. 示例(来自百度百科
    一口袋里有3只红球、2只白球,采用不放回方式摸取,求:
    ⑴ 第一次摸到红球(记作A)的概率;
    ⑵ 第二次摸到红球(记作B)的概率;
    ⑶ 已知第二次摸到了红球,求第一次摸到的是红球的概率。
    解:
    ⑴ P(A)=3/5,这就是先验概率;
    ⑵ P(B)=P(A)P(B|A)+P(A逆)P(B|A逆)=3/5
    ⑶ P(A|B)=P(A)P(B|A)/P(B)=1/2,这就是后验概率。
  5. 一些公式及联系
    ⑴ 对任意事件A和B,联合概率:P(A, B) = P(A | B)P(B)
    如果A和B事件是相互独立的,则 P(A,B) = P(A) x P(B)。
    更一般的公式:P (A1, A2, · · · , Ak) = πk=1nP (Ak | A1, A2, · · · , Ak-1)
    示例:
    P(A4, A3, A2, A1) = P(A4| A3, A2, A1)P(A3 | A2, A1)P(A2 | A1)P(A1)
    ⑵ 后验概率:P(A|B)=P(A, B)/P(B) =P(A | B)P(B)/P(B)

贝叶斯公式

  1. 贝叶斯公式
    贝叶斯公式
             其中P(A|B)是在B发生的情况下A发生的可能性。A1,A2…An为完备事件组,P(A1)+P(A2)+…+P(An) = 1。例如P(B) = P(B)(P(A) + P(A逆)) = P(B)P(A) + P(B)P(A逆)。
  2. 贝叶斯公式的其他形式及推导
    bo
    推导:
    根据条件概率的定义,在事件B发生的条件下事件A发生的概率
        P(A|B)=P(A∩B)/P(B)
    同样地,在事件A发生的条件下事件B发生的概率
        P(B|A)=P(A∩B)/P(A)
    整理与合并上述两个方程式,便可以得到
        P(A|B)P(B)=P(A∩B)=P(B|A)P(A)
    接着,上式两边同除以P(B),若P(B)是非零的,我们便可以得到贝叶斯定理的公式表达式:
        P(A|B)=P(B|A)*P(A)/P(B)
  3. 显然通过贝叶斯公式我们得到的是P(A | B),即贝叶斯定理个给我们提供了一个通过求P(B | A),P(A),P(B)而求得P(A | B)的途径。

朴素贝叶斯原理

基本概念

  1. 朴素贝叶斯中假设各特征独立。
  2. 朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

朴素贝叶斯分类的定义过程

  1. 待分类项:设x = /a1, a2, … ,am/ 为一个待分类项,而每个ai为x的一个特征属性。
  2. 类别集合:设类别集合C=/y1, y2, … ,yn/
  3. 求P(yi, x):计算P(y1, x),P(y2, x),… ,P(yn, x)。
  4. 分类:若P(yk, x) = max(P(y1, x),P(y2, x),… ,P(yn, x)),则待分类项属于第k类。

    其中关键就是如何计算第3步中的各个条件概率。
    找到一个已知分类

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值