我们使用回归分析创建模型,描述变量在预测变量对响应变量的影响。有时,如果我们有一个类别变量,如Yes / No或Male / Female等。简单的回归分析为分类变量的每个值提供多个结果。在这种情况下,我们可以通过将分类变量与预测变量一起使用并比较分类变量的每个级别的回归线来研究分类变量的效果。这样的分析被称为协方差分析,也称为ANCOVA。
例
考虑在数据集mtcars中内置的R语言。在其中我们观察到字段“am”表示传输的类型(自动或手动)。它是值为0和1的分类变量。汽车的每加仑英里数(mpg)也可以取决于马力(“hp”)的值。
我们研究“am”的值对“mpg”和“hp”之间回归的影响。它是通过使用aov()函数,然后使用anova()函数来比较多个回归来完成的。
输入数据
从数据集mtcars创建一个包含字段“mpg”,“hp”和“am”的数据框。这里我们取“mpg”作为响应变量,“hp”作为预测变量,“am”作为分类变量。
input print(head(input))
当我们执行上面的代码,它产生以下结果 -
am mpg hp
Mazda RX4 1 21.0 110
Mazda RX4 Wag 1 21.0 110
Datsun 710 1 22.8 93
Hornet 4 Drive 0 21.4 110
Hornet Sportabout 0 18.7 175
Valiant 0 18.1 105