统计与机器学习数据挖掘:响应模型与市场细分分类建模
1. 响应模型构建与优化
1.1 初始模型分析
在构建响应模型时,我们首先考虑了变量 X1、X2 以及它们的交互项 X1X2。最初的模型显示,TCCR(X1, X2, X1X2)为 55.64%,这一结果暗示在模型中 X1 是一个不必要的变量。经过分析,我们得到了目前为止最简约的响应模型,该模型由 X2 和 X1X2 定义。
1.2 模型探索与改进
对 RESPONSE 和 X2 的关系进行深入探索时,我们发现两者关系在右上角部分有轻微弯曲,这表明可能存在二次成分。因此,我们在模型中引入了 X2 的平方项 X2_SQ 进行测试。
以下是不同模型的详细信息:
| 模型 | TCCR (%) | 正确分类的响应者数量 | RCCR (%) | 类型 | 定义变量 |
| — | — | — | — | — | — |
| 基础模型 | 48.37 | 1704 | 1.10 | 基础 | X1, X2 |
| 完整模型 | 55.64 | 1478 | 1.11 | 完整 | X1, X2, X1X2 |
| 目前最佳模型 | 55.64 | 1477 | 1.11 | 最佳 | X2, X1X2 |
| 最优模型 | 64.59 | 1256 | 1.19 | 最优 | X2, X1X2, X2_SQ |
从这些数据可以看出,引入 X2_SQ 后,模型的 TCCR 从 55.64% 提升到了 64.59%,有了 16.1% 的显著提升。这表明包含 X2、X1X2 和 X2_SQ 的模型是最适合数据的响应模
超级会员免费看
订阅专栏 解锁全文
1227

被折叠的 条评论
为什么被折叠?



