pytorch（二）梯度下降算法

原创

已于 2024-01-22 09:04:32 修改 · 1.1k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #算法 #人工智能

于 2024-01-20 19:59:47 首次发布

文章目录

在线性模型训练的时候，一开始并不知道w的最优值是什么，可以使用一个随机值来作为w的初始值，使用一定的算法来对w进行更新

优化问题

寻找使得目标函数最优的权重组合的问题就是优化问题

梯度下降

通俗的讲，梯度下降就是使得梯度往下降的方向，也就是负方向走。一般来说，梯度往正方向走，表示梯度大于0,，表示函数是往递增方向走，而这里需要的是找最低点，最低点一定是在往下走，所以这里的梯度要取负号。梯度下降更新权重的公式如下（注意是减），α表示学习率：
在这里插入图片描述
梯度下降算法属于贪心算法的一种，它的权重的更新，每一次都是朝着梯度下降最快的方向进行更新，当梯度为0的时候，算法收敛，权重不再更新。梯度下降可能得到的是一个局部最优解（非凸函数）。

在深度学习中，尽管梯度下降算法会陷入局部最优，但是在深度学习中梯度下降算法依旧广泛应用：在之前大家认为，深度学习的目标函数会出现很多的局部最优解，但是实际上，其损失函数并没有很多的局部最优解。但是深度学习的损失函数会存在很多的鞍点（也就某一点上梯度为0，从一个切面上看是最小值，从另一个切面看是最大值的点，如下图），导致权重无法继续迭代，可以使用动量法来解决鞍点问题。

在这里插入图片描述

代码实现：

要求：模拟梯度下降算法，计算在x_data、y_data数据集下，y=w*x模型找到合适的w的值。
和第二课不同的是，第一课的w是我们认为设定的，通过一个for循环使得w迭代，这一次需要的是通过模型找到适合的w

import matplotlib.pyplot as plt

x_data=[1.0,2.0,3.0]
y_data=[2.0,4.0,6.0]

w=1.0
# 求预测值
def forward(x):
    return x*w

# 损失函数
def cost(xs,ys):
    costs=0
    # 用zip打包成元祖，并返回元祖组成的列表
    for x,y in zip(xs,ys

最低0.47元/天解锁文章