【论文阅读笔记】Using the Output Embedding to Improve Language Model

最新推荐文章于 2025-05-10 20:35:12 发布

寸先生的牛马庄园

最新推荐文章于 2025-05-10 20:35:12 发布

阅读量2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/cskywit/article/details/94905959

机器学习专栏收录该内容

96 篇文章

订阅专栏

设Word2Vec等词向量训练模型的输入词向量为U，输出词向量为V，通常模型训练完成后，只是用U作为预训练词向量给其他上游模型使用，V通常忽略，本文探讨了U和V使用的效果，已经联合使用U和V的想过，得出以下结论：

1、在Word2Vec Skipgram模型中，输出词向量与输入词向量的效果相比稍差。

2、在基于RNN的语言模型中，输入词向量比输入词向量想过更好。

3、通过将这两种嵌入结合在一起，即强制U = V，联合嵌入的效果更类似于输出嵌入，而不是未绑定模型的输入嵌入。

4、将输入和输出嵌入绑在一起，可以改进各种语言模型的困惑度。

5、当不使用dropout时，建议在V之前添加一个额外的投影P，并对P应用正则化。

6、神经翻译模型中的权值绑定可以在不影响性能的前提下将它们的大小(参数数量)减少到原来大小的一半以下。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。