训练神经网络的常用方法之共轭梯度法

最新推荐文章于 2024-11-19 09:15:49 发布

luckykq

最新推荐文章于 2024-11-19 09:15:49 发布

阅读量3.6k

点赞数 1

文章标签：算法深度学习机器学习人工智能

本文链接：https://blog.youkuaiyun.com/weixin_47414849/article/details/113871139

版权

共轭梯度法是一种结合梯度下降法和牛顿法优点的优化算法，仅需一阶导数信息，避免了存储和计算海塞矩阵的需求。此算法在解决大型线性方程组和非线性优化问题上表现优秀，具有步长收敛性和高稳定性。提供的代码示例展示了如何用共轭梯度法求解正定线性方程组，通过调整停机绝对误差限可以控制迭代次数和精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

共轭梯度法是介于梯度下降法与牛顿法之间的一个方法，它仅需利用一阶导数信息，既克服了梯度下降法收敛慢的缺点，又避免了牛顿法需要存储和计算海塞矩阵并求逆的缺点，共轭梯度法不仅是解决大型线性方程组最有用的方法之一，也是解大型非线性最优化最有效的算法之一。在各种优化算法中，共轭梯度法是非常重要的一种。其优点是所需存储量小，具有步收敛性，稳定性高，而且不需要任何外来参数。
共轭梯度法的迭代公式如下所示：
在这里插入图片描述
使用共轭梯度法对正定线性方程组进行求解，代码如下所示

function [er,k]=ConGra(A)
%共轭梯度法求解正定线性方程组Ax=b
%er:表示停机时实际的绝对误差
%k:表示停机时实际的迭代次数
tol=1e-6;%规定停机绝对误差限
[n,m]=size(A);
if n~=m %判断输入的合法性
    error('wrong input');
end
x=zeros(n,1); %初始化解向量,产生n行1列的全零矩阵
b=ones(n,1);
r=b-A*x;%当前残量
k=0;%记录迭代次数
while norm(r,2)>tol   %求r的2范数
    k=k+1;
    if k==1
        p=r;%第一步即最速下降法，取残量方向,p为步长
    else
        q=(r'*r)/(rq'*rq);
        p=r+q*p;
    end
    a=(r'*r)/(p'*A*p);
    x=x+a*p;
    rq=r;
    r=r-a*A*p;
end
er=norm(A*x-b,2);
end

再编写一个m文件对矩阵A进行赋值即可求出相应的迭代次数和误差。