深度学习原理 Lesson 12:进阶训练技术;从零搭建ULMFiT

本文介绍了深度学习中的进阶训练技术,包括LSTM、MixUp、Label Smoothing、Mixed Precision Training和XResNet。重点讲解了ULMFiT,这是一个用于文本分类的通用语言模型微调方法。同时,阐述了如何处理NLP数据,如使用TextList、Tokenize Processor和Numericalize Processor。文章还涉及了AWD-LSTM,一种结合Dropout的LSTM模型,并提供了数据准备和模型训练的详细步骤。

2ed72cf0d3503279e393bad06a1231a7.jpeg

1

   

简介

主要讲解了transfer learning 和 NLP 的原理会用到大量的callbacks

  1. MixUp:一个数据增强技术,用更少的数据,更少的训练时间,实现同样的效果

  2. Label Smoothing:和MixUp搭配使用,适用于label中有噪音的情况(即错误数据)

  3. Mixed Precision Traing:混合精度的训练,在许多场景下都能快3倍以上

  4. XResNet:ResNet的升级版本,重新部署下

  5. ULMFiT:文本分类 的通用语言模型 微调 Universal Language Model Fine-tuning for Text Classification

    1. LSTM RNN

    2. 处理NLP数据

5b0127e6409aaa5d36e1a4e7d35570ee.png

2

   

MixUp

就是随机把2张图重叠到一起,让机器去识别这两种的可能性,最终可以实现用更少的数据得到更好的效果。

调用方式 Learner.mixup( )如下图:70%是高尔夫球 30%是狗

bd74a2e04506001c42478f7a1533b664.png

3

   

Label Smoothing

训练时有些数据被错误的标记,尤其是数据量很大时,很难一个

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值