机器学习解释性:概念、差异与应用
在当今时代,数据和算法主导着众多规则和程序。例如,信贷审批、社交媒体帖子审查、营销战术选择以及肺炎诊断等方面,都离不开数据和算法的支持。过去,这些规则和程序往往被硬编码在软件、教科书和纸质表格中,人类是最终的决策者。然而,如今金融机构通过训练包含大量变量的模型来评估抵押贷款违约的可能性,决策更多地依赖于算法。那么,如何理解和信任这些机器学习模型的决策呢?这就涉及到机器学习解释性的相关概念。
什么是机器学习解释
在机器学习中,解释某事物意味着解释算法的含义。算法是一种数学公式,它接收输入数据并产生输出。以简单线性回归模型为例,其公式为:
$$
\hat{y} = \beta_0 + \beta_1x_1
$$
其中,$\hat{y}$ 是预测值,$x_1$ 是特征变量,$\beta_0$ 和 $\beta_1$ 是系数。这个公式解释了输入数据 $x_1$ 如何转换为输出 $\hat{y}$。
为了更详细地说明,我们以一个简单的体重预测模型为例。该模型使用身高来预测体重,数据来自加利福尼亚大学维护的网页: http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_Dinov_020108_HeightsWeights 。我们只使用网页上的 200 条样本记录。
以下是实现该模型的具体步骤:
1. 安装所需
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



