神经网络分类与先验类概率及大规模模式识别方法
1. 神经网络分类中的缩放技术效果
在神经网络分类任务里,缩放技术有着重要作用。从混淆矩阵来看,当不进行缩放($cs = 0$)时,类别 3 和 4 的敏感度较低。而使用 $cs = 1$ 进行缩放后,所有类别都能被识别,但类别 1 的敏感度变差,类别 3 和 4 的误报率显著增加。
下面是不同方法的平均均方敏感度误差(MSSE)结果:
| 方法 | 最佳 $cs$ 时的平均 MSSE | 所有 $cs$ 的平均 MSSE |
| — | — | — |
| 先验缩放 | 0.10($cs = 0.8$) | 0.19 |
| 先验缩放 + 后缩放 | 0.096($cs = 0.6$) | 0.10 |
| 概率采样 | 0.099($cs = 0.8$) | 0.18 |
| 概率采样 + 后缩放 | 0.089($cs = 0.8$) | 0.099 |
| 均衡化 | 0.195($cs = 0.3$) | 0.195 |
可以看出,先验缩放和先验缩放结合后缩放的结果与概率采样的结果很相似,但稍差一些。对于低 $cs$ 值,先验缩放和概率采样的表现非常相似;而对于高 $cs$ 值,概率采样在这个问题上有明显优势。此外,当使用先缩放或概率采样方法结合后缩放时,选择最优 $cs$ 值的重要性降低。
下面是一个简单的流程图展示不同缩放方法的大致流程:
graph LR
A[输入数据] --> B{是否进行先验缩放}
B -- 是 -->
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



