线性回归算法是使用线性方程对数据集进行拟合的算法,是一个非常常见的回归算法。
单变量线性回归算法
1.预测函数
针对数据集x和y,预测函数会根据输入特征x来计算输出值h(x)。其输入输出的函数关系如下:
h θ ( x ) = θ 0 + θ 1 x h_{\theta}(x)=\theta_{0}+\theta_{1} x hθ(x)=θ0+θ1x这个方程表达的是一条直线。我们的任务是构造一个hθ函数,来映射数据集中的输入特征x和输出值y,使得预测函数hθ计算出来的值与真实值的整体误差最小。构造hθ函数的关键,就是找到合适的θ0,θ1的值,θ0,θ1称为模型参数。模型的求解过程,就是找出一组最合适的模型参数θ0,θ1,以便能最好地拟合数据集。
怎样来判断最好地拟合了数据集呢 ?
当拟合成本最小时,即找出了最好的拟合参数。
2.成本函数
单变量线性回归算法的成本函数是: h θ ( x ) = θ 0 + θ 1 x J ( θ ) = J ( θ 0 , θ 1 ) = 1 2 m ∑ i = 1 m ( h ( x ( i ) ) − y ( i )