一、线性回归
线性回归一般用来做连续值的预测,预测结果为一个连续值。因为训练时学习样本不仅要提供学习的特征向量X,还要提供样本的实际结果,所以它是一种有监督学习。
表示数据矩阵,其中
表示一个n维长的数据样本,
表示数据标记。线性回归需要学习得到一个映射关系
,当给定新的待预测样本时,可以通过这个映射关系得到一个测试样本X的预测值y。
线性回归的数学假设
1、假设输入X和输出y是线性关系,预测的y和X通过线性方程建立模型
2、Y和X之间满足方程Y=XW+e,e是误差项、噪声项,假设e是独立同分布的,服从IID(independent and identity distribution)和均值为0、方差为某一定值的正态分布。
二、线性回归建模
当特征向量X中只有一个特征时,需要学习到的函数应该是一个一元线性函数y=ax+b