【深度学习入门】深度学习基础

深度学习基础
深度学习的基础模型包括:Linear、MLP、CNN、RNN、Transformer。其他的GRU、LSTM、BERT和GPT都是这些基础模型的变体和组合。这些模型实际上都是为了挖掘数据的特征,不同数据的表达都有相较而言适合的模型来解决(如图中的表格、文本和音频对应的模型)。本篇笔记将对这五个基础模型进行概览。(摘录于李沐老师的b站视频课程)

一、Linear Methods 线性模型

线性回归是机器学习最基础的模型,也是所有深度学习模型的基础。

1. 定义

给定 n 维输入 x = [ x 1 , x 2 , . . . , x n ] T \mathbf{x}=[x_1,x_2,...,x_n]^T x=[x1,x2,...,xn]T
线性模型有一个 n 维权重和一个标量偏差:
w = [ w 1 , w 2 , . . . , w n ] T , b \mathbf{w}=[w_1,w_2,...,w_n]^T,b w=[w1,w2,...,wn]Tb
输出是n维输入的加权和外加偏差:
y = w 1 x 1 + w 2 x 2 + . . . + w n x n + b = ⟨ w , x ⟩ + b y=w_1 x_1+w_2 x_2+...+w_n x_n + b = \langle \mathbf{w},\mathbf{x} \rangle +b y=w1x1+w2x2+...+wnxn+b=w,x+b

2. 训练

  • 训练数据(样本):
    X = [ x 1 , x 2 , . . . , x n ] T , y = [ y 1 , y 2 , . . . , y n ] T \mathbf{X}=[\mathbf{x_1},\mathbf{x_2},...,\mathbf{x_n}]^T, \mathbf{y}=[y_1,y_2,...,y_n]^T X=[x1,x2,...,xn]T,y=[y1,y2,...,yn]T
  • 训练目标(参数):
    w = [ w 1 , w 2 , . . . , w n ] T , b \mathbf{w}=[w_1,w_2,...,w_n]^T ,b w=[w1,w2,...,wn]Tb
  • 训练损失(平方损失):
    ℓ ( X , y , w , b ) = 1 2 n ∑ i = 1 n ( y i − ⟨ x i , w ⟩ − b ) 2 = 1 2 n ∥ y − X w − b ∥ 2 \ell(\mathbf{X},\mathbf{y},\mathbf{w},b)=\frac1{2n}\sum_{i=1}^n\left(y_i-\langle \mathbf{x}_i,\mathbf{w}\rangle -b\right)^2=\frac1{2n}\left\|\mathbf{y}-\mathbf{X}\mathbf{w}-b\right\|^2 (X,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值