【数据挖掘导论】HW2

这篇博客介绍了梯度下降法在多变量线性回归中的应用,包括理论概述、模型测试和编程实现。通过两个练习展示了学习率对模型收敛性的影响,以及特征缩放和均值归一化的重要性。最后讨论了随机梯度下降与批量梯度下降的优缺点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

梯度下降法的多变量线性回归

理论概述

  • 线性回归方程

    单变量线性回归只包含一个变量xxx,其线性回归方程可表示为h(θ)=θ0+θ1x1h(\theta)=\theta_0+\theta_1x_1h(θ)=θ0+θ1x1

    当模型包含多个变量时,线性回归方程:h(θ)=θ0+θ1x1+⋯+θnxn​h(\theta)=\theta_0+\theta_1x_1+\dots+\theta_nx_n​h(θ)=θ0+θ1x1++θnxn,可假设x0=1​x_0=1​x0=1,此时方程可表示成h(θ)=θ0x0+θ1x1+⋯+θnxn=∑i=0i=nθixi​h(\theta)=\theta_0x_0+\theta_1x_1+\dots+\theta_nx_n=\sum_{i=0}^{i=n} \theta_ix_i​h(θ)=θ0x0+θ1x1++θnxn=i=0i=nθixi

  • 目标(代价)函数

    • 批量梯度下降(BGD):每一次迭代时使用所有样本来进行梯度的更新

      J(θ0,θ1,…,θn)=12m∑i=1i=m(hθ(x(i))−y(i))2​J(\theta_0,\theta_1,\dots,\theta_n)=\frac{1}{2m}\sum_{i=1}^{i=m}(h_\theta(x^{(i)})-y^{(i)})^2​J(θ0,θ1,,θn)=2m1i=1i=m(hθ(x(i))y(i))2

    1. 目标函数对θi\theta_iθi求偏导

      ∂J(θ0,θ1,…,θn)∂θj=1m∑i=1i=m(hθ(x(i))−y(i))xj(i)\frac{\partial J(\theta_0,\theta_1,\dots,\theta_n)}{\partial\theta_j}=\frac{1}{m}\sum_{i=1}^{i=m}(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}θjJ(θ0,θ1,,θn)</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值