62、利用释义数据集改进词表示及提升文本交互共情的研究

利用释义数据集改进词表示及提升文本交互共情的研究

1. 利用释义数据集改进词表示

在自然语言处理(NLP)中,向量词表示对于使用机器学习算法在NLP任务中获得良好结果至关重要。近年来,有一些工作尝试结合知识库中的信息来改进词嵌入的学习,但这些工作尚未达到其方法的最先进水平,并且通常将实验限制在定制数据集上。

1.1 GloVe模型及相关公式

GloVe(Global Vectors for Word Representation)是词表示基准中的先进方法。构建矩阵 $X$ 后,GloVe 的目标是最小化 $J$ 损失函数:
- $X_i = \sum_{k} X_{ik}$ (式 53.6)
- $J = \sum_{i,j=1}^{V} f (X_{ij})(w_{i}^{T} \tilde{w} {j} + b {i} + \tilde{b} {j} - \log(X {ij}))^2$ (式 53.7)

其中,$V$ 是词汇表大小,$w_{i}$ 是中心词 $i$ 的词嵌入,$\tilde{w} {j}$ 是上下文词 $j$ 的词嵌入。因此,有两个词嵌入矩阵 $W$ 和 $\tilde{W}$。$f(x)$ 函数定义如下:
[
f(x) =
\begin{cases}
(x/x
{max})^{\alpha}, & \text{if } x < x_{max} \
1, & \text{otherwise}
\end{cases}
]
(式 53.8)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值