统计判别之模式分类(二)


注意:贝叶斯分类规则是基于统计概念的如果只有少数模式样本,一般较难获得最优的结果

正态分布模式的贝叶斯分类器

      当已知或者有理由设想类概率密度函数P(x|ωi)是多变量的正态分布时,上一节介绍的贝叶斯分类器可以导出一些简单的判别函数。 由于正态密度函数易于分析,且对许多重要的实际应用又是一种合适的模型,因此受到很大的重视。
      M种模式类别的多变量正态类密度函数
判别函数是一个超二次曲面。
对于正态分布模式的贝叶斯分类器,两个模式类别之间用一个二次判别界面分开,就可以求得最优的分类效果。

具有M种模式类别的多变量正态类密度函数为:


       其中,每一类模式的分布密度都完全被其均值向量mi和协方差矩阵Ci所规定,其定义为:


Ei{x}表示对类别属于ωi的模型的数学期望。

      在上述公式中,n为模式向量的维数,|Ci|为矩阵Ci的行列式,协方差矩阵Ci是对称的正定矩阵,其对角线上的元素Ckk是模式向量第k个元素的方差,非对角线上的元素Cjk是x的第j个分量xj和第k个分量xk的协方差。当xj和xk统计独立时,Cjk=0。当协方差矩阵的全部非对角线上的元素都为零时,多变量正态类密度函数可简化为n个单变量正态类密度函数的乘积。

已知类别ωi的判别函数可写成如下形式:


      对于正态密度函数,可取自然对数的形式以方便计算(因为自然对数是单调递增的,取对数后不影响相应的分类性能),则有:


     代入正态类密度函数,有:


去掉与i无关的项(并不影响分类结果),有:


即为正态分布模式的贝叶斯判别函数。

 两类问题且其类模式都是正态分布的特殊情况


当C1≠C2时的情况,显然,判别界面d1(x)- d2(x)=0是x的二次型方程,即ω1和ω2两类模式可用二次判别界面分开。
当x是二维模式时,判别界面为二次曲线,如椭圆,圆,抛物线或双曲线等。
当C1=C2 =C时的情况
判别界面为x的线性函数,为一超平面。
当x是二维时,判别界面为一直线。


(1)当 时,两类模式的正态分布为:p(x|ω1)表示为N(m1, C1),p(x|ω2)表示为N(m2, C2),ω1和ω2两类的判别函数对应为:
 

(2)当C1=C2=C时,有:
 
因C为对称矩阵,上式可简化为:

 由此可导出类别ω1和ω2间的判别界面为:
 

两类问题且其类模式都是正态分布的实例


  模式分布如图所示,若作为正态分布处理,且P(ω1)=P(ω2)=1/2,求其判别界面。

        模式的均值向量mi和协方差矩阵Ci可用下式估计:


        其中N其中Ni为类别为类别ωi中模式的数目,x中模式的数目,xij代表在第i个类别中的第j个模式。由上式可求出:


代表在第i个类别中的第j个模式。

因P(ω1)=P(ω2)=1/2,因C1=C2,则判别界面为:




 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值