44、统计与机器学习数据挖掘:模型、策略与数据处理

统计与机器学习数据挖掘:模型、策略与数据处理

1. 营销策略中的关键特征与调整

在制定包容性营销策略时,年龄(AGE)是一个显著特征。因此,“年龄”信息必须进行策略性调整,以适应第 1 至 6 分位数(模型实施的典型范围)内的个体。具体调整如下:
| 分位数 | 调整策略 |
| ---- | ---- |
| 2 | 营销策划者必须在“年龄”信息中加入收入(INCOME)因素 |
| 4 和 6 | 营销策划者必须以年龄为基调,重点关注性别(GENDER) |
| 5 | 营销策划者必须在“年龄”信息中加入性别因素 |

2. 回归模型中变量重要性的评估方法

2.1 传统方法的局限性

传统上,使用原始回归系数的大小或标准化回归系数(SRC)来确定模型中哪些变量是最重要的预测因子。然而,这两种系数都不能完美地对预测变量进行重要性排序。原始回归系数没有考虑变量单位的不平等性,而当变量相关时(在数据库应用中几乎是普遍情况),SRC 在理论上存在问题。

2.2 标准化回归系数的作用

基于 SRC 的排名可以提供有用的信息,且不会产生复杂的结果。一个未被广泛认知的假设是,随着预测变量之间的平均相关性降低,基于 SRC 的排名可靠性会增加。因此,对于构建良好、预测变量之间相关性最小的模型,这种排名方法是一种被接受的做法。

2.3 预测贡献系数(PCC)的优势

预测贡献系数(PCC)比 SRC 提供了更多有用的信息。它可以在模型性能的分位数水平上对预测变量进行排名,并能识别一种新定义的预测变量类型——关键驱动因素。通过一个小数据集

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值