利用释义数据集改进词表示及提升文本交互共情的研究
1. 利用释义数据集改进词表示
在自然语言处理(NLP)中,向量词表示对于使用机器学习算法在NLP任务中获得良好结果至关重要。近年来,有一些工作尝试结合知识库中的信息来改进词嵌入的学习,但这些工作尚未达到其方法的最先进水平,并且通常将实验限制在定制数据集上。
1.1 GloVe模型及相关公式
GloVe(Global Vectors for Word Representation)是词表示基准中的先进方法。构建矩阵 $X$ 后,GloVe 的目标是最小化 $J$ 损失函数:
- $X_i = \sum_{k} X_{ik}$ (式 53.6)
- $J = \sum_{i,j=1}^{V} f (X_{ij})(w_{i}^{T} \tilde{w} {j} + b {i} + \tilde{b} {j} - \log(X {ij}))^2$ (式 53.7)
其中,$V$ 是词汇表大小,$w_{i}$ 是中心词 $i$ 的词嵌入,$\tilde{w} {j}$ 是上下文词 $j$ 的词嵌入。因此,有两个词嵌入矩阵 $W$ 和 $\tilde{W}$。$f(x)$ 函数定义如下:
[
f(x) =
\begin{cases}
(x/x {max})^{\alpha}, & \text{if } x < x_{max} \
1, & \text{otherwise}
\end{cases}
]
(式 53.8)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



