符号回归模型的解释与变量重要性评估
1. 符号回归可视化与模型解释概述
符号回归(Symbolic Regression)中的可视化图表能让用户探究模型对输入变量变化的响应,这对于具有交互输入的模型尤为有趣。不过,部分依赖图(PDP)和交集图假设各输入变量相互独立,在输入变量存在相关性的建模任务中,这种假设可能导致误导,因为图表展示的输入向量预测在现实中可能无法或很少出现。对远离训练点的输入值进行预测不确定性的可视化是很有帮助的。
这些可视化工具能帮助理解模型的输入 - 输出行为,但无法深入了解模型内部结构。而解释模型对于提升其可信度至关重要,它是一个研究甚至逆向工程机器学习模型内部结构和运行规则的过程,目的是更好地理解变量间的潜在关系。在符号回归中,解释模型意味着理解信息在模型结构中的流动,以及输入值的非线性变换和输入间的局部交互。
2. 变量重要性评估
2.1 变量重要性的概念
符号回归模型将输入值进行(非线性)变换得到预测输出。在许多应用场景,如医疗领域,全面理解模型的计算过程十分关键。至少,量化每个变量对整体预测的重要性很重要,若模型有效,这对底层系统也有重要意义。变量重要性本身就能为建模系统提供重要见解。
变量重要性可通过计算每个输入变量能解释目标变量多少方差来量化,这与前面讨论的部分依赖图在概念上相关。若一个变量能解释目标变量很大一部分方差,它就是重要的;若不能提供关于目标变量的任何信息,它就是不重要的。此概念可扩展到变量集,以计算多个变量的组合重要性。
2.2 逐步变量选择方法中的变量重要性计算
变量重要性的计算在逐步变量选择方法中至关重要,该方法有向前和
超级会员免费看
订阅专栏 解锁全文
700

被折叠的 条评论
为什么被折叠?



