SPSS(六)SPSS之回归分析衍生方法(图文+数据集)
我们知道线性回归是有适用条件的
- 因变量的独立性
- 正态性
- 方差齐性
- 无极端值
- 自变量、因变量要有线性趋势
假如不满足以上的条件,还能做回归分析吗?其实有一大类针对此相关的方法
曲线拟合过程
针对问题:自变量、因变量无线性趋势
- 直线关系毕竟是较少数的情形,当因变量和自变量呈曲线关系时:
有明确的公式:利用变量变换将曲线直线化,然后加以拟合
关系不明:基于图形观察,拟合可能的曲线,从中挑选出最为合适的一个
- 具体拟合方法:根据所选择的公式,将自变量和因变量进行变量变换,然后按照直线回归的方式进行拟合
- 可拟合的曲线种类
高次方曲线:一、二、三次方曲线
指数、对数、幂曲线
特殊类型曲线:S形曲线、生长曲线等
简单来说分两种情况
- 第一种情况:一个是已经给出表达式,我们将其进行变量转换为线性,之后进行回归
- 第二种情况:另一个是我们结合可拟合的曲线种类,看哪一个表达式拟合效果比较好,挑选这个表达式进行线性变换,之后回归
案例:通风时间和毒物浓度的曲线方程(第一种情况)
根据文献资料,随着通风时间的增加,密闭空间内污染物的浓度应当呈指数方程下降。现考察某通风设备的换气效果,在室内放置了某种挥发性物质(模拟毒物),待其充分分散到室内空气中后开始通风,每一分钟测量一次室内空气中的毒物浓度,请建立时间与空气中毒物浓度的指数方程。
(已有明确的方程,按此拟合即可。等价于先进行变量变换,然后拟合直线方程)
数据集如下
1 2.1250
2 1.7420
3 1.2360
4 1.1270
5 .7310
6 .4690
7 .4000
8 .3810
9 .2840
10 .2760
11 .0620
12 .0610
13 .0408
14 .0428
15 .0305
首先进行变量变化(转换----计算变量)
建一个新变量,对原始的y进行ln运算,使之ln(y)与x成线性关系
建模
结果查看,一般我们只关注和几个地方
R方:决定系数,衡量模型可用性及模型信息量的表达,越接近1越好
Anova:里面的Sig.表示lny与x解决问题使用线性回归模型是否可行的
系数a:Sig.这个因变量纳入这个模型有没有意义
还有一个比较快的方法,不用计算出新的变量(分析----回归----曲线估计)