深度学习调参经验


调参是锦上添花的事,而底线取决于:模型的选择和数据的清洗。

模型最后的性能如何应该主要取决于以下四点:

  1. 数据集
  2. 模型
  3. 损失函数和优化器
  4. 模型的训练与测试

数据集

  • 数据量太多时,先用少量(1/10 or 1/100)的数据去跑,估算训练时间
  • 视觉一定要使用数据增强
  • 数据一定要进行预处理
  • 数据输入时,观察数据质量;模型训练结束后,观察bad case

模型

  • 尽量不要自己手写模型,找一个没有bug或者已经走通的模型自己去修改。
  • 数据量太小时,找预训练模型去微调
  • RELU、Sigmoid、Softmax、Tanh,常用的激活函数
  • 输出层用sigmoid与softmax,中间层用RELU,RNN用Tanh
  • Dropout与BN非常好用

损失函数与优化器

  • Lr与Batch size相互影响,互相成正比
  • Lr有很多trick,如指数下降
  • 观察loss曲线,及时early stopping
  • Adam快速收敛,SGDM精度高(如果非要二选一,Adam)

训练与测试

  • 参数初始化方法,首先为预训练,其次为Xavir
  • 训练loss低,但测试loss高,模型泛化能力不行
  • 每次调参只改一个参数
  • 在验证时,可设置某规则以使模型向想要的方向更新

参考:点击这里链接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值