【数据挖掘导论】HW2

最新推荐文章于 2019-10-25 02:37:17 发布

我叭想起名啊

最新推荐文章于 2019-10-25 02:37:17 发布

阅读量410

点赞数

CC 4.0 BY-SA版权

分类专栏：数据挖掘导论文章标签：梯度下降法多变量线性回归

本文链接：https://blog.youkuaiyun.com/qq_36318771/article/details/88971581

这篇博客介绍了梯度下降法在多变量线性回归中的应用，包括理论概述、模型测试和编程实现。通过两个练习展示了学习率对模型收敛性的影响，以及特征缩放和均值归一化的重要性。最后讨论了随机梯度下降与批量梯度下降的优缺点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

梯度下降法的多变量线性回归

线性回归方程

单变量线性回归只包含一个变量 $x$ ，其线性回归方程可表示为 $h(θ)=θ0+θ1x1h(\theta)=\theta_0+\theta_1x_1$ 。

当模型包含多个变量时，线性回归方程： $h(θ)=θ0+θ1x1+⋯+θnxnh(\theta)=\theta_0+\theta_1x_1+\dots+\theta_nx_n$ ，可假设 $x_0=1$ ，此时方程可表示成 $h(θ)=θ0x0+θ1x1+⋯+θnxn=∑i=0i=nθixih(\theta)=\theta_0x_0+\theta_1x_1+\dots+\theta_nx_n=\sum_{i=0}^{i=n} \theta_ix_i$ 。
目标（代价）函数
- 批量梯度下降(BGD)：每一次迭代时使用所有样本来进行梯度的更新
  
  $J(θ0,θ1,…,θn)=12m∑i=1i=m(hθ(x(i))−y(i))2J(\theta_0,\theta_1,\dots,\theta_n)=\frac{1}{2m}\sum_{i=1}^{i=m}(h_\theta(x^{(i)})-y^{(i)})^2$
1. 目标函数对 $θi\theta_i$ 求偏导
  
  $∂J(θ0,θ1,…,θn)∂θj=1m∑i=1i=m(hθ(x(i))−y(i))xj(i)\frac{\partial J(\theta_0,\theta_1,\dots,\theta_n)}{\partial\theta_j}=\frac{1}{m}\sum_{i=1}^{i=m}(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}$