总览
如题,这篇文章中文名《可解释机器学习中无基本事实的解释评价》,是属于机器学习可解释性方向的一篇入门级综述,是一篇纯理论性的文章,主要内容包括三个方面:
- 机器学习可解释性方法的分类
- 机器学习可解释性方法的评估标准、属性和框架
- 机器学习可解释性方法的不足
重点在于评估的属性和框架部分。
概述
摘要中是这么说的:“本文严格定义了评价解释的问题,并对已有的研究成果进行了系统的回顾。具体来说,我们用正式的定义概括了解释的三个一般方面(即可预见性、忠实性和说服力),并分别回顾了在不同任务下各自具有代表性的方法。此外,根据开发人员和最终用户的层次需求,设计了一个统一的评估框架,在实际应用中可以很容易地适用于不同的场景。最后,对现有评价技术存在的问题进行了探讨,指出了现有评价技术存在的一些局限性,为今后的探索提供了参考。”
以下是本文的思维导图:
写本文所要解决的问题:
可解释性模型可以帮助人们更好的了解机器学习系统如何工作,加强模型的可靠性。但是,很少有对可解释性模型的评估标准的明确定义,难以在主观和客观的“可解释性”之间取得一个平衡或者共识。
本文解决此问题的方法和具体行文流程:
- 将现在的可解释性方法进行了分类
- 提出了三个“可解释性”方法的属性
- 根据提出的属性,对现有的解释性评估工作进行系统的审查,重点是各种应用中的不同技术
- 根据提出的属性,设计了一个评估“可解释性”机器学习模型的框架