模型无关方法:全局可解释性
在机器学习领域,模型可解释性是一个至关重要的问题。之前我们了解了白盒和黑盒这两种不同类型的机器学习模型,并且重点关注了如何解释白盒模型。黑盒模型虽然具有较高的预测能力,但正如其名,难以解释。接下来我们将聚焦于解释黑盒模型,特别是模型无关且具有全局范围的技术。
1. 模型无关方法与全局可解释性概述
模型无关的可解释性技术不依赖于所使用的具体模型类型,它们独立于模型的内部结构,因此可以应用于任何模型。全局范围的可解释性技术则有助于我们从整体上理解整个模型。
这里将重点探讨树集成方法,特别是随机森林。不过,所学到的模型无关技术可以应用于任何模型。
2. 高中学生成绩预测问题
我们通过一个具体的例子来展开,从医疗领域的Diagnostic+问题转向教育领域。美国一个学区的负责人希望解决一个数据科学问题,即了解学生在数学、阅读和写作这三个关键学科领域的表现,以便确定各学校所需的资金水平,并确保每个学生都能在《每个学生成功法案》(ESSA)下取得成功。具体来说,她希望预测该学区高中生在这三门学科的成绩,成绩分为A、B、C或F。
2.1 问题建模
由于模型的目标是预测成绩(四个离散值之一),所以这个问题可以被表述为分类问题。负责人收集了该学区1000名来自不同学校和背景的学生的数据,每个学生有以下五个数据点:
- 性别
- 种族
- 家长教育水平
- 学生购买的午餐类型
- 考试准备水平
基于这些数据,需要为每个学科领域训练一个单独的分类器。
2.2 探索性数据分析
超级会员免费看
订阅专栏 解锁全文
913

被折叠的 条评论
为什么被折叠?



