这是第二十讲内容:一元线性回归分析。
一元线性回归是指分析两个变量间(自变量x和因变量y)数量依存关系和影响的统计分析方法。
对于只涉及一个自变量的一元线性回归模型可表示为:
y= b0+b1 X+ϵ
Y:回归模型中的因变量,即样本的预测值。
X:回归模型中的自变量,即样本的特征数值。
ε:回归模型中的误差项,即不能被x与y之间线性关系解释的变异性。
b0:是常量。
b1: 回归系数。
一、实战案例
小白想了解下大侠的人均月收入能否预测他们年体育消费额,试构建一元线性回归模型,并检验其显著性。(部分数据如下,完整数据请回复【小白数据】下载)
该案例主要研究人均月收入与体育消费额的关系,从专业知识上可认为人均月收入是可以预测他们的年体育消费额。
二、统计策略
针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:关联研究,在理论上认为变量之间存在因果关系,即月收入可预测体育消费额。
Q2:本案例属于什么研究设计?
A:调查性研究。
Q3:分析数据有多少组?
A:两组数据。
Q4:有几个变量?
A:有两个变量,两变量均为连续性变量
自变量为人均月收入
因变量为体育年消费额。
Q5:变量之间是否相关?
A:变量之间需要满足线性相关,呈现线性趋势。
Q6:残差是否具有独立性、方差齐性和正态分布?
A: