Neural Transducer, MoCha笔记
首先,先来看看什么是Neural Transducer。
如上图所示,我们可以发现Neural Transducer其实就是在输出时加了一个attention。
我们可以把n个h来作为一个window,然后利用attention来进行输出处理。
根据上图也会对实际window的大小选择起到指导作用。
接下来,我们来看看什么是MoCha:
如上图所示,MoCha可以选择是否把一个h计入一个window中。
如上图,系统可以告诉z是否把h输入到一个window中。
就如以上两张图就说明了以上过程。