机器学习（四）- linear regression

最新推荐文章于 2022-01-11 15:17:05 发布

原创最新推荐文章于 2022-01-11 15:17:05 发布 · 509 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#线性回归

stanford机器学习学习笔记专栏收录该内容

23 篇文章

订阅专栏

本文深入探讨了线性回归的基本概念，包括如何利用训练集拟合参数θ，通过特征选取和模型假设建立预测方程。介绍了线性回归的迭代更新公式和梯度下降法，同时阐述了在矩阵形式下的表示。最后，提供了MATLAB代码示例，展示了不依赖代价函数迭代和基于代价函数优化两种情况的实现。

linear regression

线性回归很简单，就是运用我们已知的数据集(training set)去拟合出一组 $θ\theta$ ，等同于在空间中拟合出了一条曲线，然后我们就可以利用下面的方程进行数据预测了。当然这些都是在我们已经完成了特征选取和模型假设之后，特征选取就是 $x$ 向量中的每个值（比如对于预测房价，我们觉得可能跟房子大小和卧室个数有关，所以我们的 $x$ 就有两个值，一个代表房子大小，一个代表卧室个数），模型假设就是 $hθ(x)h_\theta(x)$
$hθ(x)=θTx=θ0+θ1x1+...+θnxnh_\theta(x)=\theta^Tx=\theta_0+\theta_1x_1+...+\theta_nx_n$
具体步骤其实只有下面这个迭代方程：
$θj:=θj−α1m∑i=1m(hθ(x(i))−y(i))xj(i)\theta_j:=\theta_j-\alpha\frac{1}{m}\sum_{i=1}^m (h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}$
对于每一个 $θ\theta$ ，我们运用梯度下降。转换为矩阵形式就是：
$θ:=θ−α1m(XT(Xθ−y))\theta := \theta-\alpha\frac{1}{m}(X^T(X\theta-y))$
需要提一句的是，这里的矩阵 $X$ 还需要包含 $x_0$ ，也就是一个全1向量，矩阵 $X$ 应该有 $n + 1$ 个column。
下面是matlab代码实现

for iter = 1:num_iters
    theta = theta - alpha*(1/m)*(X'*(X*theta-y));
end

如果我们不需要设置迭代结束的阈值，即代价函数。那么我们就只需要上面这个函数，设置一个迭代次数，我们就能求到我们的 $θ\theta$ 。
如果我们需要运用代价函数，那么就需要用到下面这个方程：

$J(θ)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta)=\frac{1}{2m}\sum_{i=1}^m (h_\theta(x^{(i)})-y^{(i)})^2$
转化为矩阵形式就是：
$J(θ)=12m(Xθ−y)T(Xθ−y)J(\theta) = \frac{1}{2m}(X\theta-y)^T(X\theta-y)$
下面是matlab代码实现

    J = 1/(2*m)*((X*theta-y)'(X*theta-y));