统计与机器学习数据挖掘:模型评估与交互变量指定
1. 平均相关性在模型评估中的应用
在模型评估中,平均相关性是一个重要的指标。只要平均相关值可接受(小于 0.40),就可以进入评估竞争模型的环节。模型构建者通常会构建多个模型,然后从中选择最佳模型。当项目产生的模型平均相关值在可接受范围内时,模型构建者会同时使用平均相关值和预测变量与因变量的个体相关性集合。个体相关性反映了模型的内容有效性,以下是个体相关系数值的经验规则:
- 值在 0.0 到 0.3(0.0 到 -0.3)之间表示有效性较差。
- 值在 0.3 到 0.7(-0.3 到 -0.7)之间表示有效性中等。
- 值在 0.7 到 1.0(-0.7 到 -1.0)之间表示有效性较强。
下面通过 LTV5 模型来具体说明。LTV5 模型的平均相关性为 0.33502,预测变量与 LTV5 的个体相关性(如下表所示)表明,除了 VAR2 外,这些变量具有中等至较强的有效性。0.33502 与表中值的组合让模型构建者对 LTV5 模型的可靠性和有效性感到满意。
| Predictors | CORR_COEFF_with_LTV5 |
|---|---|
| VAR8 | 0.71472 |
| VAR7 | 0.70277 |
| VAR6 | 0.68443 |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



