teacher forcing 和 auto regressive 相关概念【小白记笔记】

在RNN中,存在两种训练模式:
1、free-running mode:上一个state的输出作为下一个state的输入
2、teacher-forcing mode:ground truth作为下一state的输入,而不是将上一state的输出作为下一state的输入。这样可以避免在某个state出现错误,导致后面的都错了。
体现到transformer中,就是decoder的输入是全部目标序列(ground truth),尽管前一步可能出现错误,这一步仍然要输入正确的。

auto regressive:仅根据过去的预测对未来进行预测。

参考博客:

https://www.cnblogs.com/dangui/p/14690919.html
https://blog.youkuaiyun.com/flyfish1986/article/details/137923037
https://zhuanlan.zhihu.com/p/425667693

如有错误,请多指教!欢迎交流!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值