泊松回归包括回归模型,其中响应变量是计数形式。 例如,足球比赛系列中的出生次数或胜利次数。 此外,响应变量(因变量y)的值遵循泊松分布。
泊松回归的一般数学方程为 :
log(y) = a + b1x1 + b2x2 + bnxn…
以下是所使用的参数的描述 :
- y是响应变量。
- a和b是数字系数。
- x是预测变量。
glm( ) 函数
在泊松回归中glm()函数的基本语法是 :
glm(formula,data,family)
以下是在上述功能中使用的参数的描述:
- formula是表示变量之间的关系的符号。
- data是给出这些变量的值的数据集。
- family是R语言对象来指定模型的细节。 它的值是“泊松”的逻辑回归。
举个栗子:
我们有内置的数据集“warpbreaks”,其描述了羊毛类型(A或B)和张力(低,中或高)对每个织机的经纱断裂数量的影响。
让我们考虑“breaks”作为响应变量,它是断裂次数的计数。 羊毛类型"wool"和张力"tension"作为预测变量。
输入:
input <- warpbreaks
print(head(input))
输出:
breaks wool tension
1 26 A L
2 30 A L
3 54 A L