使用实例级解释对二分类器可视诊断的工作流程
论文内容:
(1) 论文背景
医院急诊室在对急诊病人进行诊断时,最终需要判断病人是否需要住院治疗,但通常无法在第一时间做出这样的决策,医生在对病人做出全方面的诊断后才会通知其他部门该病人是否需要住院。但是,病人在进入急诊室时就将锁定一个床位,在等待最终确认住院的过程中,需要花费数小时,这对医疗资源造成了浪费。
因此,有人根据医生的处方单训练了一个二分类器,用来预测病人是否需要住院治疗。
但这样的分类器是否可靠?以及如何改进?本文基于此问题,设计了一个用于可视诊断二分类器的工作流程。因为机器学习本身的黑盒属性,本文提供实例级别的解释,对分类模型进行可视化呈现,并在此基础上进行对模型进行改进。
此处的论文背景即是本文的Case Study。
(2) 论文方法
1) 可视化设计目标:
G1: What is theoverall accuracy of the model? (global)
G2: What are themain individual decisions the model makes? (local)
G3: How accurateare individual decisions the model makes? (local)
G4: How can onechange the data or the model to improve its decisions?
2) 模型诊断流程