一.先验分布,后验分布与似然估计
先验分布:因,,根据一般经验认为应该满足的分布
后验分布:由果所因,,根据当前数据修正的随机变量的分布
似然估计:由因至果,
二.贝叶斯公式(后验)
大名鼎鼎的公式:
全概率公式:
贝叶斯公式:(下面是果的全概率公式,上面是因的先验概率和条件概率)
三.朴素贝叶斯做分类问题
PS:之所以说朴素是因为它的特征之间是相互独立的。
已知量 |
1.一群对象。 有固定种类(A1,A2...An) 每个对象都有固定的特征(B1,B2...Bn)。
2.有一个对象O,知道它的特征。 |
求 | 这个对象是哪一个种类。 |
方法(公式) |
朴素贝叶斯公式带入计算,用概率判断。
P(种类|特征)=P(种类)×{P(特征|种类)/P(特征)} |
公式解释(建议自己思考,公式某项不懂再查) |
黑体:后验概率(即在这种特征下,是这个种类的概率) 斜体:先验概率(即样本中,该种类的概率) 下划线:影响因子(大则偏向这个种类,小则反之。 绿色:该种类下,是该特征的概率,然后多项乘。紫色:全概率公式计算) |
已知量 |
1.对象:猫 种类(波斯,暹罗,英短) 特征(体型,毛色,瞳色) PS:特征,种类等都统计明确。
2.有一个猫,给出了体型,毛色,瞳色。 |
求 | 判断它是什么品种 |
方法 |
P(波斯|(体型,毛色,瞳色))=P(波斯)×{P(体型,毛色,瞳色|波斯)/P(体型,毛色,瞳色)}
P(暹罗|(体型,毛色,瞳色))=P(暹罗)×{P(体型,毛色,瞳色|暹罗)/P(体型,毛色,瞳色)}
P(英短|(体型,毛色,瞳色))=P(英短)×{P(体型,毛色,瞳色|英短)/P(体型,毛色,瞳色)}
PS: 红色:就是这个项占整体的。 绿色:使用全概率公式计算。 |
结果 | 那个种类的概率最大,结果就是哪个。 |
高斯 | 先验服从高斯分布,适用特征大多数是连续型。 |
多项式 |
先验是多项式分布,适用于特征是多元离散。 |
贝努力 | 先验是贝努力分布,适用特征是二元离散,或者稀疏多元离散。 |