资料链接:
感谢篇:
十分感谢外研在线技术中心算法团队各位老师在我实习期间给予的帮助,好嗨皮的时光,学到了很多东西。【悄悄告诉你们:他们非常耐心 <( ̄▽ ̄)/】
系列文章目录
《实习日记(二):序列建模工具包——Fairseq》
《实习日记(三):mRASP&mRASP2中的RAS及AA源码解读》
《实习日记(四):mRASP2模型评估+demo部署》
前言
本文简单记录一下《Pre-training Multilingual Neural Machine Translation by Leveraging Alignment Information,mRASP》和《Contrastive Learning for Many-to-many Multilingual Neural Machine Translation,mRASP2》的要点,需要更详细的同学们建议阅读原文。
一、mRASP
1.1 基本思想
(一)、想要解决的问题: 能否开发一个通用的机器翻译模型作为公共种子并在任意语言对上获得衍生和改进模型?
(二)、论文思路: 基本的思路非常简单,就是将多语言平行语料混合在一起进行sequence-to-sequence的训练。
(三)、关键技术: 随机对齐替换技术,它使跨多种语言具有相似含义的单词和短语在表示空间中更接近。
1.2 模型架构
论文中采用标准的Transformer结构( 6-layer enco