今天刚读了一篇文本匹配相关的论文,发表于AIII2018,名为Knowledge Enhanced Hybrid Neural Network for Text Matching。
顾名思义,也就是说通过引入先验知识的方式来提升文本匹配问题的准确度。这个改进是有一定的意义的,文章中说传统的匹配问题中,对于文本长度超过一定长度的数据匹配结果非常不准确。以QA问题为例,在一些较长的回答中,可能会包含一些对问题的延伸,来进一步解释问题。这种回答往往质量很高,却因为这些语义并不相近的延伸被判定为不好的匹配。因此文章提出了这样的一个模型。
首先解释什么是先验知识,文中对于QA问题使用的先验知识就是问题的类型,对于对话问题是用的先验知识是通过训练好的LDA模型提取得到的主题。有了先验知识,就可以开始构建模型了:
模型总共分为三个部分,得到三个矩阵:
(1)将两段文本分别表示成词向量矩阵,计算各词向量之间的相似度得到相似度矩阵,计算公式如下:
其中的h是激活层,采用RELU函数
(2)将两段文本分别表示成词向量矩阵,通过两个biGRU重新得到两个向量矩阵,再得到交互矩阵,计算公式如下: