个人对梯度下降算法的理解:
下降的速度由超参数a决定
首先设置一个初始的权重值和一个下降速率a
然后求损失函数在初始权重点的导数 让初始权重减去这个导数与下降速率a的乘积得到新的权重值
这样一步一步的求新权重值,直到导数趋近于0的时候 这时候损失函数得到最小 于是得到了最佳的权重公式:
个人对梯度下降算法的理解:
下降的速度由超参数a决定
首先设置一个初始的权重值和一个下降速率a
然后求损失函数在初始权重点的导数 让初始权重减去这个导数与下降速率a的乘积得到新的权重值
这样一步一步的求新权重值,直到导数趋近于0的时候 这时候损失函数得到最小 于是得到了最佳的权重公式: