how to train network(李宏毅课程)

在这里插入图片描述

Model Bias

  1. add the features
  2. make your model complex, improve the level of the net

Optimization Issue

在这里插入图片描述

  1. If deeper networks do not obtain smaller loss on training data在这里插入图片描述
  2. problems: gradient is close to zero(critical point)

local minima: mostly the question you face is not local minima for the dimensions you choose
saddle point
在这里插入图片描述
how to distinguish the two points
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Overfitting

  1. solution

1 more training data
2 data augmentation
在这里插入图片描述
3 constrained model

less parameters
sharing parameters: CNN
early stopping
less features
regularization
dropout
在这里插入图片描述

Mismatch

your training and testing data have different distributions

Batch

在这里插入图片描述

  1. shuffle: every epoch, the batch is different
  2. small batch

more noisy and better performance on training data and testing data
more time consume
在这里插入图片描述
在这里插入图片描述

Momentum

Gradient Descent + Momentum
在这里插入图片描述

Error Surface

norm of gradient is not low, but loss can not reduce
在这里插入图片描述
but if we reduce the learning rate, the speed of converge is too slow

Solution:
for different parameters
在这里插入图片描述

for the same parameter in different time
在这里插入图片描述
Learning rate scheduling

  1. Learning rate decay: as the training goes, we are closer to the destination, so we reduce the learning rate
  2. warm up: increase and then decrease

summary
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值