神经网络简介-多层神经网络

w326639619

于 2016-11-05 16:47:01 发布

阅读量1.5k

点赞数

分类专栏：机器学习神经网络文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/w326639619/article/details/53046263

版权

本文介绍了神经网络的基础知识，重点讨论了具有三层结构的神经网络，详细阐述了输入层、隐藏层和输出层的标记方式以及权重计算。同时，文章对比了批量梯度下降和随机梯度下降两种权重更新方法，前者适用于小规模训练数据，全局最优但计算量大；后者则在大规模训练数据中展现快速收敛特性，但可能带来模型误差。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上一节介绍了神经元及相关内容，本节我们看一下神经网络

如上图所示，该神经网络有三层。我们标记第一层（也就是输入层）为 $a^{(1)}$ ，第一层与第二层连接权重为 $w^{(1)}$ ，然后第一层输入与第一层权重的线性和为 $z^{(1)}$ ，第一层神经元个数为 $n^{(1)}$ ，并依次标记剩余网络层。
可以看出，存在

z (l) j = \sum i = 1 n (l) a (l) i \cdot w (l) i, j = a (l) ⊤ w (l) j

$z^{(l)}_{j}=\sum_{i=1}^{n^{(l)}}a^{(l)}_{i}\cdot w^{(l)}_{i,j}={a^{(l)}}^{\rm{\top}}w^{(l)}_{j}$

a (l + 1) = f (z (l))

$a^{(l+1)}=f(z^{(l)})$

f(⋅) $f(\cdot)$ 是激活函数。

对于多层神经网络，我们定义其代价函数为

J (w, b) = 1 2 n \sum i = i n (y i - h (x i)) 2

$J(w,b)=\frac{1}{2n}\sum_{i=i}^{n}\left( y_{i}-h(x_{i})\right)^{2}$
其中

(xi,yi) $(x_{i},y_{i})$ 是样本集合，

h(⋅) $h(\cdot)$ 是网络预测函数，通常为了防止过拟合，需要在后面加上一项正则项，用来约束参数复杂度。
当网络预测结果（

h(⋅) $h(\cdot)$ ）与样本的ground truth（

yi $y_{i}$ ）接近时，代价函数最小。换言之，我们要想使得预测结果准确，那么需要最小化代价函数

J(⋅) $J(\cdot)$ 。
此时，利用梯度下降算法，我们知道参数的更新公式如下所示：

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。