模式识别第二章统计决策方法

本文深入探讨贝叶斯决策理论,解析最小错误率与最小风险决策,讲解如何通过后验概率进行决策,以及灵敏度与特异度在评估分类效果中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简单的例子:

判断周杰伦手中的硬币是几毛钱,根据个人的经验,会给出这个事件一个经验判断-称之为先验概率,例如P(一角)=0.4,P(五角)=0.6,那么我们会猜测周杰伦手中的硬币是5角钱的.

如果允许对硬币进行测量重量(仍然不知道物体具体类别,可以增添某些提示信息),当我们知道重量为0.5g的时候为一角钱和五角钱的概率如下P(一角|0.5g)=0.1, P(五角|0.5g)=0.9,那么我们就可以通过增添的一个信息量,把我们误判率限定在0.1.

既然增添了一个信息提示会使得我们的信息增益这么大,那么我们就应该采用这种方法去进行计算,接下来的问题就是这个后验概率如何去算:

p(w_{i}|x)=\frac{p(x,w_{i})}{p(x)}=\frac{p(x|w_{i})p(w_{i})}{p(x)}

其中,P(wi)是先验概率,P(x|wi)成为类条件密度,就是当我们需要对所有五毛钱测每一个重量,看一下重量为x的概率为多少.p(x)是两类硬币重量为x的概率密度之和.

 

Notations:

假设样本x \in R^{d}是由d维实数特征组成的,即x=[x_{1},x_{2},...,x_{d}]^{T},其中T第是转置符号.

假定要研究的类别有c个,记作w_{i},i=1,2...,c,类别数c已知,且各类的先验概率也都已知.另外,还假定各类中的样本的分布密度即类条件密度P(x|wi)是已知的,我们所要做的决策就是,对于某个位置样本x,判断它属于哪一类.

p(e|x)=\left\{\begin{matrix} & p(w_{2}|x) ,if x \in w_{1}\\ & p(w_{1}|x),if x \in w_{2} \end{matrix}\right.

如此定义了一个服从同样分布的独立样本上错误率的期望:

P(e)=\int P(e|x)p(x)dx

如何理解这个公式,首先这个公式是一个分段函数,e取w1或者w2,当e取w1的时候,就是x在w2空间中对这个式子进行积分,得到的是错误的被分到w1中的概率.当计算这个错误率最小的时候考虑因为P(x)是不变的,那么就使得P(e|x)最小即可,也即正确分类最大.

 

最小错误率贝叶斯决策:

 

决策规则:

如果P(w1|x)>P(w2|x),那么x属于第一类w1

 

P(w_{i}|x)=\frac{p(x|w_{i})P(w_{i})}{p(x)}=\frac{p(x|w_{i})p(w_{i})}{\sum_{j=1}^{2}p(x|w_{j})p(w_{j})}

先验概率P(wi)和类条件密度p(x|wi),i=1,2都已知

 

P16 书中的例子:细胞类别状态的例子很好

 

最小风险贝叶斯决策:

关心错误率所带来的损失,把正常细胞误判为癌细胞,会给病人带来精神上的负担和不必要的进一步检查,这是一种损失;反之,如果把癌细胞误判为正常细胞,则损失更大,因为这可能会导致病人丧失了宝贵的早期发现癌症的机会,可能会造成影响病人生命的严重后果.最小风险贝叶斯决策就是考虑各种错误造成的损失

 

Notations:

i).把样本x看做d维随即向量x=[x1,x2,...,xd]^{T}

ii).状态空间\Omega由c个可能的状态组成:\Omega =\{w_{1},w_{2},...,w_{c}\}

iii).对随机变量x可能采取的决策组成了决策空间,它由k个决策组成: A=\{\alpha_{1},\alpha_{2},...,\alpha_{k}\},这里没有假定k=c,这是更一般的情况,比如除了判别为某一类外,对某些样本还可以做出决策,即不能判断属于任何一类;有时也可以在决策时把几类合并为同一大类.

iv).设对于实际状态为w_{j}的向量x,采取决策\alpha_{i}所带来的损失为:

\lambda (\alpha_{i}, w_{j}), i=1,...,k, j=1,...,c

然后根据这个公式给出损失函数的一般决策表

对于某个样本x,它属于各个状态的后验概率是P(wj|x),对它采取决策 \alpha_{i}, i=1,...,k 的期望损失为:

R(\alpha_{i}|x)=E[\lambda (\alpha_{i},w_{j})|x)]=\sum_{j=1}^{c} \lambda (\alpha_{i},w_{j})P(w_{j}|x)

 

最小风险贝叶斯决策过程:

1.利用贝叶斯公式计算后验概率:p(wj|x) j=1,...,c (注意,与最小错误率贝叶斯决策一样,这里仍然要求先验概率和类条件概率已知)

2.利用决策表,计算条件风险:

R(\alpha_{i}|x)=\sum_{j=1}^{c}\lambda (\alpha_{i}|w_{j})P(w_{j}|x), i=1,...,k

3.决策:在各种决策中选择风险最小的决策:

\alpha=argmin R(\alpha_{i}|x)

注意:

最小风险风险贝叶斯决策中的决策表是需要人为确定的,决策表不同会导致决策结果的不同

 

两类错误率 经常在论文中会看到-灵敏度Sn和特异度Sp

真阳性和真阴性都是正确的分类,错误的分类有假阳性和假阴性两种情况,假阳性(实际状态是阴性但是错分到阳性),假阴性(实际状态是阳性但是错分阴性)

假阳性率:是假阳性数据占所有阴性样本的比率

假阴性率:是所有假阴性数据占所有阳性样本的比率

 

用TP TN FP FN 分别代表某次实验中的真阳性,真阴性,假阳性,假阴性样本的个数,灵敏度Sn和特异度Sp的定义分别为:

Sn=\frac{TP}{TP+FN }   表示真正的阳性样本中有多少比例能被正确的检测出来

Sp=\frac{TN}{TN+FP}   表示真正的阴性样本中有多少比例能够被正确的检测出来

一种诊断方法的灵敏度高指的是他能把所有有病的人都诊断出来,而特异性高则表示它不易把无病的人误诊为有病.

灵敏度和特异性是一对矛盾,如果某种方法把所有检查的人都说成有病,那么不会错过任何一个真正的病人,灵敏度为100%,但是把所有健康人也误诊为病人;相反的,如果他把所有人都检查为无病,那么他自然不会误诊,特异性为100%,但却把真正的病人漏诊了.我们需要根据疾病的具体情况在两种极端之间取得平衡,

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值