机器学习:神经网络与深度学习的原理、应用场景及优缺点

一、神经网络与深度学习概述

深度学习是机器学习的一个分支领域,它通过构建具有多个层次的神经网络来自动学习数据的特征表示。神经网络是深度学习的基本模型结构,模拟了生物神经元之间的信息传递方式。

二、深度神经网络(DNN)

  1. 原理

    • 深度神经网络由多个神经元组成的多个隐藏层构成,输入层接收数据,输出层产生预测结果。每个神经元接收来自上一层神经元的输出作为输入,通过加权求和并加上偏置后,再经过激活函数进行非线性变换。
    • 假设神经元jjj在第lll层,其输入为x=(x1,x2,⋯ ,xn)\boldsymbol{x}=(x_1,x_2,\cdots,x_n)x=(x1,x2,,xn),权重为w=(w1j,w2j,⋯ ,wnj)\boldsymbol{w}=(w_{1j},w_{2j},\cdots,w_{nj})w=(w1j,w2j,,wnj),偏置为bjb_jbj,则神经元的加权求和操作(线性组合)为:zj=∑i=1nwijxi+bjz_j=\sum_{i = 1}^{n}w_{ij}x_i + b_jzj=i=1nwijxi+bj
    • 激活函数通常是非线性的,如Sigmoid函数σ(z)=11+e−z\sigma(z)=\frac{1}{1 + e^{-z}}σ(z)=1+ez1、ReLU函数f(z)=max⁡(0,z)f(z)=\max(0,z)f(z)=max(0,z)等。神经元的输出为aj=f(zj)a_j = f(z_j)aj=f(zj)
    • 在训练过程中,通过反向传播算法来更新权重和偏置。反向传播基于链式法则计算损失函数(如均方误差MSE=1m∑i=1m(yi−y^i)2MSE=\frac{1}{m}\sum_{i = 1}^{m}(y_i - \hat{y}_i)^2MSE=m1i=1m(yiy^i)2,其中mmm是样本数量,yiy_iyi是真实标签,y^i\hat{y}_iy^i是预测标签)对每个权重和偏置的梯度,然后使用梯度下降算法(如随机梯度下降w=w−α∂L∂ww = w - \alpha\frac{\partial L}{\partial w}w=wαwL,其中α\alphaα是学习率,LL
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

rubyw

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值