4.1 多维特征
https://www.bilibili.com/video/BV164411b7dx?p=18
目前为止,我们探讨了单变量/特征的回归模型,现在我们对房价模型增加更多的特征,例如房间数、楼层、楼屋年限等,构成一个含有多个变量的模型,模型中的特征为(x1,x2,…,xn)。
增添更多特征后,我们引入一系列新的注释:
n 代表特征的数量
x(i)代表第 i 个训练实例,是特征矩阵中的第i行,是一个**向量**(**vector**)。
比方说,上图的,x(2)=[14163240]
xj(i)代表特征矩阵中第 i 行的第 j 个特征,也就是第 i 个训练实例的第 j 个特征。
如上图的x2(2)=3,x3(2)=2
支持多变量的假设 h 表示为:hθ(x)=θ0+θ1x1+θ2x2+…+θnxn,
这个公式中有n+1个参数和n个变量,为了使得公式能够简化一些,引入x0=1,这样就有n+1个参数和n+1个变量,只是以后我们都固定设x0=1,则公式转化为:hθ(x)=θ0x0+θ1x1+θ2x2+…+θnxn
此时模型中的参数是一个n+1维的向量,任何一个训练实例也都是n+1维的向量,特征矩阵X的维度是 m∗(n+1)。 因此公式可以简化为:hθ(x)=θT × X,其中上标T代表矩阵转置。
4.2 多变量梯度下降
https://www.bilibili.com/video/BV164411b7dx?p=19
与单变量线性回归类似,在多变量线性回归中,我们也构建一个代价函数,则这个代价函数是所有建模误差的平方和,即:
其中:
我们的目标和单变量线性回归问题中一样,是要找出使得代价函数最小的一系列参数。 多变量线性回归的批量梯度下降算法为:
我们再回到用两个参数的梯度下降来推演多个参数的梯度下降
两个参数θ0,θ1: