一、神经网络与深度学习概述
深度学习是机器学习的一个分支领域,它通过构建具有多个层次的神经网络来自动学习数据的特征表示。神经网络是深度学习的基本模型结构,模拟了生物神经元之间的信息传递方式。
二、深度神经网络(DNN)
-
原理
- 深度神经网络由多个神经元组成的多个隐藏层构成,输入层接收数据,输出层产生预测结果。每个神经元接收来自上一层神经元的输出作为输入,通过加权求和并加上偏置后,再经过激活函数进行非线性变换。
- 假设神经元jjj在第lll层,其输入为x=(x1,x2,⋯ ,xn)\boldsymbol{x}=(x_1,x_2,\cdots,x_n)x=(x1,x2,⋯,xn),权重为w=(w1j,w2j,⋯ ,wnj)\boldsymbol{w}=(w_{1j},w_{2j},\cdots,w_{nj})w=(w1j,w2j,⋯,wnj),偏置为bjb_jbj,则神经元的加权求和操作(线性组合)为:zj=∑i=1nwijxi+bjz_j=\sum_{i = 1}^{n}w_{ij}x_i + b_jzj=∑i=1nwijxi+bj。
- 激活函数通常是非线性的,如Sigmoid函数σ(z)=11+e−z\sigma(z)=\frac{1}{1 + e^{-z}}σ(z)=1+e−z1、ReLU函数f(z)=max(0,z)f(z)=\max(0,z)f(z)=max(0,z)等。神经元的输出为aj=f(zj)a_j = f(z_j)aj=f(zj)。
- 在训练过程中,通过反向传播算法来更新权重和偏置。反向传播基于链式法则计算损失函数(如均方误差MSE=1m∑i=1m(yi−y^i)2MSE=\frac{1}{m}\sum_{i = 1}^{m}(y_i - \hat{y}_i)^2MSE=m1∑i=1m(yi−y^i)2,其中mmm是样本数量,yiy_iyi是真实标签,y^i\hat{y}_iy^i是预测标签)对每个权重和偏置的梯度,然后使用梯度下降算法(如随机梯度下降w=w−α∂L∂ww = w - \alpha\frac{\partial L}{\partial w}w=w−α∂w∂L,其中α\alphaα是学习率,LL

最低0.47元/天 解锁文章
9347






