Excel线性回归分析

一、学习任务

  1. 线性回归练习。“父亲高则儿子高,父亲矮则儿子矮”(即父亲与儿子身高相关,且为正相关)、“母高高一窝,父高高一个”(即母亲的身高比父亲的身高对子女的影响更大)的习俗传说是否成立?请在“父母子女身高”数据集(高尔顿数据集)基础上利用线性回归做出科学分析。
    1)选取父子身高数据为X-Y,用Excel计算线性回归方程和相关系数、方差、p值等,判断回归方程是否成立。 现在如果有一个新家庭的数据,已知父亲身高75英寸,请测算儿子的身高为多少?
    2)选取母子身高数据为X-Y,用Excel计算线性回归方程和相关系数、方差、p值等,判断回归方程是否成立。
    3)根据以上数据,阐明你对习俗说法是否正确的分析。
    4)你能用多元线性回归方法,计算出父亲、母亲与儿子身高的回归方程吗?
  2. 线性回归方法的有效性判别。 针对“Anscombe四重奏”数据集,用excel对四组数据进行线性回归分析,判断其中哪些回归方程是成立的,哪些不成立?不成立的应该如何解决?

二、学习内容

1.1.高尔顿数据集进行线性回归分析

1.1.1.父母身高平均值和其中一个子女身高进行回归分析

1.对数据集的数据处理
1.1.通过Excel求每个家庭父母身高的平均值
求平均值的方法如下图
在这里插入图片描述
1.2.每个家庭保留一个子女的身高
在这里插入图片描述
勾选重复项
在这里插入图片描述
2.数据进行数据分析
将每对夫妇的平均身高作为自变量X,他们其中一个子女的身高作为因变量Y。
在这里插入图片描述
生成图标如下
在这里插入图片描述
添加趋势线
在这里插入图片描述
选择线性
在这里插入图片描述
最终图表如下
在这里插入图片描述
3.相关数据的解释
通过上面公式y=0.5702x+31.801,当父母身高每增加1个单位,其子女的身高平均增加0.5702个单位。
相关系数R平方计算的结果约为0.12,表面父母身高的平均值与子女身高的线性相关性较弱。P值远小于0.01,得到的回归方程是可靠的。
在这里插入图片描述

1.1.2.父子身高回归方程

最终图表如下:
在这里插入图片描述
通过公式y=0.2962x+49.27,当父身高每增加1个单位,子女的身高平均增加0.2962个单位。
相关系数R平方计算的结果约为0.06,表面父母身高的平均值与子女身高的线性相关性较弱。P值远小于0.01,说明得到的回归方程是可靠的。

1.1.3.母子身高回归方程

最终图表如下:
在这里插入图片描述
通过公式y=0.3545x+44.291,当母身高增加1个单位,子的平均身高增加0.3545, R²=0.056308,表面父母身高的平均值与子女身高的线性相关性较弱。P值远小于0.01,说明得到的回归方程是可靠的。

1.2.Anscombe四重奏数据集进行回归分析

1.2.1 数据集一:
在这里插入图片描述
通过分析:测定系数 = 0.666542,残差平方和 = 13.76269,P 值 = 0.00217
回归方程:y = 0.5x + 3。该线性回归方程不成立,无法做回归分析。
2.1.2.数据集二:
在这里插入图片描述
通过分析:测定系数 = 0.666242,残差平方和 = 13.77629,P 值 = 0.002179,回归方程:y = 0.5x + 3,该线性回归方程不成立。
2.1.3.数据集三:
在这里插入图片描述
通过分析:测定系数 = 0.666324,残差平方和 = 13.75619,P 值 = 0.002179,回归方程:y = 0.5x + 3。该线性回归方程基本能够体现该数据集的一个变化情况。
2.1.4.数据集四:
在这里插入图片描述
通过分析:测定系数 = 0.666707,残差平方和 = 13.74249,P 值 = 0.002165,回归方程:y = 0.5x + 3。该线性回归方程不成立。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值