统计与机器学习数据挖掘:模型、策略与数据处理
1. 营销策略中的关键特征与调整
在制定包容性营销策略时,年龄(AGE)是一个显著特征。因此,“年龄”信息必须进行策略性调整,以适应第 1 至 6 分位数(模型实施的典型范围)内的个体。具体调整如下:
| 分位数 | 调整策略 |
| ---- | ---- |
| 2 | 营销策划者必须在“年龄”信息中加入收入(INCOME)因素 |
| 4 和 6 | 营销策划者必须以年龄为基调,重点关注性别(GENDER) |
| 5 | 营销策划者必须在“年龄”信息中加入性别因素 |
2. 回归模型中变量重要性的评估方法
2.1 传统方法的局限性
传统上,使用原始回归系数的大小或标准化回归系数(SRC)来确定模型中哪些变量是最重要的预测因子。然而,这两种系数都不能完美地对预测变量进行重要性排序。原始回归系数没有考虑变量单位的不平等性,而当变量相关时(在数据库应用中几乎是普遍情况),SRC 在理论上存在问题。
2.2 标准化回归系数的作用
基于 SRC 的排名可以提供有用的信息,且不会产生复杂的结果。一个未被广泛认知的假设是,随着预测变量之间的平均相关性降低,基于 SRC 的排名可靠性会增加。因此,对于构建良好、预测变量之间相关性最小的模型,这种排名方法是一种被接受的做法。
2.3 预测贡献系数(PCC)的优势
预测贡献系数(PCC)比 SRC 提供了更多有用的信息。它可以在模型性能的分位数水平上对预测变量进行排名,并能识别一种新定义的预测变量类型——关键驱动因素。通过一个小数据集
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



