ESIM模型解析-文本匹配

最新推荐文章于 2024-07-21 10:29:48 发布

Jaggar_csdn

最新推荐文章于 2024-07-21 10:29:48 发布

阅读量1.4k

点赞数 2

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Jaggar_csdn/article/details/103391492

Enhanced LSTM for Natural Language Inference(ESIM)为文本匹配模型，在之前的短文本匹配比赛中取得了不错的效果，故现对该模型进行一些总结。该模型综合利用了biLSTM和attention机制，将一个句子各单词与另一个句子各单词特征相关性进行表示，再进行差积分析，凸显了局部推理信息，可以说这是这个模型的一大亮点。原论文中还有编码以及推理合成部分都利用TreeLSTM替代biLSTM，鉴于效果不如biLSTM本文不做讨论，感兴趣的可以去查看原论文。

论文链接：https://arxiv.org/pdf/1609.06038.pdf

biLSTM编码
假设输入句a、句b，首先采用biLSTM分别对这两个句子进行编码。
$\overline{a_{i}}=BiLSTM(a,i) \\ \overline{b_{i}}=BiLSTM(b,i)$
$ai‾\overline{a_{i}}$ 为将a再输入时间i的隐藏状态,也就是a句中i单词进行编码时的输出状态，b句也按此操作。此处利用双向LSTM模型在单词的上下文关联上会有更好的效果，单词所在的语境可以表现在编码后。
Local Inference Modeling
这个模块为该模型最大的创新点，主要在句子基础上表征了两句词之间的关系，并凸显了某一句单词对另一句各单词之间的产生的影响。
先采用点积计算两句间各单词的attention权重：
$ei,j=ai‾Tbj‾e_{i,j}=\overline{a_i}^T\overline{b_j}$
然后对两句各单词之间进行交互性计算，可见该词与另一句子联系越大，则计算出的值也会越大：
$ai~=∑j=1lbexp(ei,j)∑k=1lbbj‾\tilde{a_i}=\sum^{l_b}_{j=1}\frac{exp(e_{i,j})}{\sum^{l_b}_{k=1}}\overline{b_j}$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。