
第8到12行为正向传播算法,输出一个损失函数。
(其中h为sigmod激活函数,第11行为L2损失函数)
第14到20行为反向传播算法,使用梯度下降法对权值进行优化。
注:常见的几种Activation Functions

本文详细解析了深度学习中正向传播算法与反向传播算法的工作原理。正向传播部分介绍了通过sigmoid激活函数计算预测值,并使用L2损失函数评估模型误差。反向传播部分则展示了如何利用梯度下降法优化网络权重,实现模型参数的迭代更新。

第8到12行为正向传播算法,输出一个损失函数。
(其中h为sigmod激活函数,第11行为L2损失函数)
第14到20行为反向传播算法,使用梯度下降法对权值进行优化。
注:常见的几种Activation Functions

您可能感兴趣的与本文相关的镜像
Llama Factory
LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调
1510
235
512

被折叠的 条评论
为什么被折叠?