线性回归
平方误差
每个点同直线的误差,也就是它到直线的竖直距离
可看作直线对这些点拟合程度的一种度量
决定系数
内涵:波动程度能被 x 的波动程度所描述
剩余 总波动中有多少百分比没有被回归线所描述
所以如果直线的平方误差很小,意味着直线拟合的很好,此时R-Squared接近1;相反如果平方误差很大,则R-Squared就会接近于0
协方差
定义:两随机变量离各自均值距离之积的期望值,同步程度决定协方差大小
方差分析
定义:分析数据总波动有多少是由于组内波动造成,有多少是由于组外波动造成
SST:方差的分子部分,自由度为 mn-1
SSW:组内平方和,即不同分组内数据对组均值差的平方和之和,自由度为 m(n - 1),因为知道各组内 n - 1 个数据就可以求出第 n 个数据的值
SSB:组间平方和,内涵为总波动有多少是因为组均值之间的波动,即不同分组均值对总均值差的平方和,自由度为 m - 1,因为知道 m - 1 个组的均值就可以求出第 m 个组的均值
从上述可以发现SST的自由度恰好等于SSB与SSW自由度之和,可以说明数据的总波动可以分解为两个分量的波动之和,一个是组内,一个是组间
F统计量假设检验
如果分子比分母大很多,则说明波动大多数来自于各组之间
因果性和相关性
存在因果关系则一定相关,但存在相关关系并不一定因果
演绎推理
归纳推理:用已有信息进行趋势外推,趋势不一定继续
任务四
最新推荐文章于 2023-05-13 10:04:23 发布