不要过于教条地对待研究的结果,尤其当数据的质量受到怀疑时。
本文主要对统计学中最常见的一元线性回归内容进行系统全面的讲解,以及相应案例的Excel Spss 和Java的相关实现。
准备知识 : 对概率中随机变量的期望、方差、协方差、和相关系数的定义、性质和简单的计算。可参考期望,方差,协方差及相关系数
[注释:]上述参考文档中在性质3中线性组合的方差中书写错误: 正确如下:
参考资料 :贾俊平统计学第6版.
一元线性回归内容详解
1.1 变量间的关系
变量与变量之间的关系呢可以分为两种:
(1)函数关系;
(2)相关关系;
函数关系:设有两个变量 x 和
相关关系 :当变量之间的这种确定关系变为不确定的数量关系,就是相关关系。
相关关系的特点:一个变量的取值并不能由另一个变量唯一确定,当变量 x 取某个值时,变量
1.2 相关关系的描述和测度
相关分析要解决的问题:
(1)变量之间是否存在关系;
(2)如果存在关系,他们之间是什么样的关系;
(3)他们之间的关系强度如何;
(4)如何确定用样本所反映的变量之间的关系可以代替总体变量之间的关系。
前提假设:
(1)两个变量之间是线性关系;
(2)两个变量都是随机变量。
步骤 :
(1)绘制散点图来判断变量之间的关系形态,如果是线性关系,可以用相关系数来测度两个变量的关系强度。
(a)正线性相关;
(b)负线性相关;
(c)完全正线性相关;
(d)完全负线性相关;
(e)非线性相关;
(f)不相关。
(2)对相关系数进行显著性检验,以判断样本所反映的关系能否用来代表两个变量总体上的关系。
总体相关系数 ρ :根据总体数据计算的,称为总体相关系数;
样本相关系数 r :根据样本的数据计算的,称为样本相关系数;
样本相关系数计算公式 :
公式简化: