
这本书里之所以用的是梯度上升,原因和前面几位楼主说的一样,是因为这本书里用的差距是y-θ(xw+b),而梯度下降法用的是θ(xw+b)-y,所以要变换符号。
https://www.zhihu.com/question/24658302/answer/73430764
本文解释了为何在某些情况下使用梯度上升而非梯度下降,并指出这取决于目标函数的形式。具体来说,当目标函数表达为y-θ(xw+b)时采用梯度上升法,反之则采用梯度下降。

这本书里之所以用的是梯度上升,原因和前面几位楼主说的一样,是因为这本书里用的差距是y-θ(xw+b),而梯度下降法用的是θ(xw+b)-y,所以要变换符号。
https://www.zhihu.com/question/24658302/answer/73430764
7705

被折叠的 条评论
为什么被折叠?