基于深度学习的文本问答模型介绍
在文本问答领域,基于深度学习的模型发挥着重要作用。下面将介绍几种常见的基于表示的深度学习模型及其工作原理。
1. 基于表示的模型概述
在基于表示的方法中,不同的神经架构被用于创建答案和问题句子的表示。每种神经架构所获得的表示通过强调句子的特定视角来呈现输入句子。这种表示可能会受到句子中所有单词的平等影响,也可能受句子最后几个单词的影响,或者仅受信息性单词的影响。此外,生成的表示可以基于局部或长期依赖关系。
2. 具体模型介绍
2.1 Severyn和Moschitti模型(2015)
该模型使用卷积神经网络(CNN)对句子的语义表示进行建模,其特殊之处在于能够结合额外的特征。具体步骤如下:
1. 输入处理 :将查询和文档句子的词嵌入输入到CNN中,构建查询($x_q$)和文档($x_d$)句子的语义表示。
2. 相似度计算 :根据噪声信道的思想计算查询和文档句子的相似度,公式为:
- $sim(x_q, x_d) = x_q^T M x_d$
其中,$M \in R^{d\times d}$ 表示相似度矩阵,用于将文档转换为与查询句子最接近的表示。
3. 特征提取与拼接 :除了捕获给定句子语义和句法相似度的 $x_{sim}$ 特征外,还提取另一个名为 $x_{feat}$ 的特征。将这两个辅助特征与查询和文档句子的表示拼接,得到 $x_{join} = [x_q^T; x_{sim}; x_d^T; x_{feat}^T]$。
超级会员免费看
订阅专栏 解锁全文
37万+

被折叠的 条评论
为什么被折叠?



