2.2.2 分类损失最小化
针对分类输出值的离散性,通常用矩阵定义损失。比如,对于普通患者被机器人医生诊断为严重,可以设定一个损失值;对于重症患者被诊断为健康,可以设定另一个损失值。设输出有K个类别,总共有K × K种不同情况需要设定损失值,用一个K × K的矩阵L表示,第k行第l列的元素为,将实际属于类别k的实例归入类别l的损失值。
理论上对于不同的误分类情况,可以设定各异的损失值。例如,将健康人诊断为健康的损失值定为0,将普通患者诊断为严重的损失值定为1,将严重患者诊断为健康的损失值定为3。不过,最常用的损失函数采用的是最简单的方案:将分类正确的损失值定为0,将分类错误的损失值定为1而无论具体的错误如何。这样的矩阵称为0–1损失矩阵。比如有3个输出类别的0–1损失矩阵为:

损失矩阵也可以表示为函数形式L(g, h(x))。0–1损失函数可以用恒等函数(Identity function)定义:

本文探讨了在分类问题中如何通过损失函数最小化来确定最佳预测。介绍了0-1损失矩阵,其中正确分类的损失为0,错误分类的损失为1。通过设置条件期望,得出选择概率最大类别的预测能最小化损失期望值。这意味着,采用0-1损失函数时,最佳预测是概率最高的类别。然而,当不同误分类有不同的损失值时,最优预测可能不再是概率最大类别。
最低0.47元/天 解锁文章
3610

被折叠的 条评论
为什么被折叠?



