五. 简单线性回归
1. 离散程度的衡量:方差,标准差。
2. 对于分类问题Y变量为类别型,对于回归问题Y变量为连续数值型。
3. 回归分析用来建立方程模拟两个或者多个变量之间如何关联,被预测的变量被称为因变量,用来进行预测的变量叫做自变量。
4. 简单线性回归的模型是:y = b0 + b1*x+e, b0,b1是参数,e是偏差,e是一个随机变量,独立,满足正太分布,并且均值为0.
接着简单线性回归方程:E(y) = b0 + b1*X,这条直线称为回归线。其中,b0是截距,b1是斜率。
正向线性关系,负向线性关系,无关系。
5. 估计得简单线性回归方程:式子的左边是自变量x等于一个给定值的时候的y的估计值。b0变成了估计截距,b1变成了估计斜率。
6. 如何衡量现在的回归线是不是最佳回归线:实际点的y值与估计值相减的平方求和最小。sum of squares最小。