https://zhuanlan.zhihu.com/p/67115572
要点:
在模型训练好后,根据attention矩阵,我们就可以得到源语言和目标语言的对齐矩阵了
通过设计一个函数将目标模块mt和源模块ms联系起来,然后通过一个soft函数将其归一化得到概率分布。
https://www.cnblogs.com/tectal/p/10796922.html
本文深入探讨了如何在模型训练完成后,利用Attention机制生成源语言与目标语言之间的对齐矩阵。通过设计函数连接源模块与目标模块,并使用Softmax函数进行归一化处理,形成概率分布,从而实现对齐。
https://zhuanlan.zhihu.com/p/67115572
要点:
在模型训练好后,根据attention矩阵,我们就可以得到源语言和目标语言的对齐矩阵了
通过设计一个函数将目标模块mt和源模块ms联系起来,然后通过一个soft函数将其归一化得到概率分布。
https://www.cnblogs.com/tectal/p/10796922.html
1293
2291

被折叠的 条评论
为什么被折叠?