简介
贝叶斯分类方法是与有监督学习中的最直观简单的方法。贝叶斯分类器缘起于贝叶斯定理,在定理的基础上发展为了朴素贝叶斯分类法(Naive Bayesian Classification)。朴素贝叶斯分类方法的好处在于简单直接,它一般用于概率推理与决策,即在信息不全的时候,通过观察随机变量,推断不可观察的随机变量。
一句话解释版本:
贝叶斯分类是利用概率论作为基础推断不可观测变量的类别,其基础原理是贝叶斯定理,后续还发展出了贝叶斯网络。
数据分析与挖掘体系位置
贝叶斯分类器是有监督学习中的一种模型。所以在数据分析与数据挖掘中的位置如下图所示。
贝叶斯定理
朴素贝叶斯、贝式网络、贝叶斯分类器,这些词汇与背后算法的理论基础都是贝叶斯定理。
贝叶斯理论是通过历史的经验来判断新的事物所具有的特征。为什么贝叶斯理论应用很广呢?举个例子说吧,你如果知道一个人感冒了,你很容易推测她咳嗽的概率。但是,如果你知道一个人咳嗽,让你反过来推测她得的病是感冒的概率,则会相对困难。而贝叶斯理论正是在解决这个问题。
首先,我们把一个人咳嗽称为事件A,把一个人感冒称为事件B。
那么,贝叶斯公式就是:
其中,
- P(A|B)被称为条件概率,