严小样儿教你做数据分析(1)——Excel做一元线性回归预测和相关系数计算

本文介绍了如何使用Excel进行一元线性回归预测和计算相关系数。首先,解释了线性回归的基本概念,通过数据区分自变量和因变量,并通过散点图观察线性关系。接着,利用FORECAST函数进行销售量与销售额的预测。其次,探讨了相关系数的意义,通过绘制散点图判断变量间的线性相关性,并使用CORREL函数计算得到0.648的相关系数,表明两者存在强相关性。

一、线性回归
1.定义
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w’x+e,e为误差服从均值为0的正态分布。
回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
2.操作
(1)准备数据
在这里插入图片描述
本文介绍的是简单的一元线性回归。准备好数据之后,一定要分清楚自变量和因变量。样本数据中很明显销售量属于自变量,而销售额属于因变量。
(2)绘制散点图
在这里插入图片描述
绘制散点图的目的是先大致观察一下这两个变量之间是否存在线性相关性,正相关还是负相关。很明显,销售量和销售额具有线性正相关性。
(3)预测结果
当老板问你:“小样儿,如果这个月的销售量是80,根据以往经验看,销售额能达到多少啊?”
在这里插入图片描述
FORECAST——这个函数可以用于通过一条线性回归拟合线返回一个预测值。
语法如下:
第一个参数为预测值,第二个参数为因变量的值,第三个参数为自变量的值。在这里插入图片描述
在这里插入图片描述
二、相关系数
1.定义
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
在实际工作过程中,主要研究两个对象之间是否具有线性相关性,以及相关程度有很大。比如,购买奶粉的顾客是否也会购买尿不湿,这两者之间的关联度有多大?就可以计算出两者的相关系数大小从而得出结论。
2.操作
(1)准备数据
在这里插入图片描述
(2)绘制散点图
在这里插入图片描述
**注意:配图有点问题,应该为散点图!!主要是数据是编的,大家理解原理即可!**绘制散点图的目的是初步定性的分析一下,两者是否具有相关性。
(3)相关系数
在这里插入图片描述
CORREL——这个函数可以用来返回两组数值的相关系数。
语法如下:
第一个参数为计算相关系数的对象1的值,第二个参数为计算相关系数的对象2的值。在这里插入图片描述
结果显示,两者的相关系数为0.648,可以认定两者存在相关性(r>0.6),一般大于0.6可认为两者属于强相关。进一步说明,买奶粉的顾客中买尿不湿的顾客也很多(反过来也可以解释),可以指导实际零售商进行商品的摆放等操作。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值