数学原理 梯度下降 梯度下降概述 why是用梯度下降: 1、求解正规方程时,求矩阵的逆内存消耗比较大,特别是当数据量和Xn非常大时,内存消耗很大。利用梯度下降求解,虽然没有正规方程求解准确,但是降低了内存消耗,是一种折中的办法。梯度下降一般不会达到最小值,一般会在最小值附近徘徊。 2、a.一个矩阵是方阵时才可逆。X不一定可逆,虽然numpy库会给出一个伪逆。b.A^-1 =A*/|A|,|A|等于0时就不存在逆 梯度下降细节 梯度下降只要在梯度上加个负号 </