回归分析与预测变量中心化:MATLAB 实现与解读
1. 回归模型基础
1.1 性别与年龄对收入的影响
在回归分析中,考虑性别和年龄对收入的影响。当性别为男性(GenderFemale = 0)时,回归方程为 Income = 48610 + 3895 * Age;当性别为女性(GenderFemale = 1)时,回归方程为 Income = 15776.923 + 3173.076923 * Age。这表明男性和女性的年龄与收入关系的斜率不同,即年龄对收入的影响因性别而异。在 MATLAB 中,使用 fitlm 函数进行回归时,可通过在模型公式中指定“interaction”项轻松包含预测变量间的交互项,还可使用 plotInteraction 函数可视化回归模型中预测变量间的交互作用。
1.2 两个二元变量的交互作用
考虑性别(两水平分类变量)和学位(三水平分类变量)对收入的影响。在无交互项的模型中,男性(GenderFemale = 0)和女性(GenderFemale = 1)在不同学位下的收入预测公式不同。以男性为例,仅拥有学士学位时,预测收入为 0;拥有硕士学位时,预测收入为 0 + 2;拥有博士学位时,预测收入为 0 + 3。同理可计算女性在不同学位下的预测收入。通过计算不同情况下的收入差异,可得出一些结论:
- β1 表示在学位不变时,女性和男性的收入差异。
- β2 表示学士学位和硕士学位持有者的预测收入差异。
- β3 表示学士学位和博士学位持有者的预测收入差异。
具体计算示例中,男性仅有学士学位时收入为 81000 美元,男性学士和硕士学位持有者的收入差距为 44000 美元,男
超级会员免费看
订阅专栏 解锁全文
836

被折叠的 条评论
为什么被折叠?



