GloVe model
单词表示模型:GloVe,用于全局向量,全局语料的统计信息直接由模型获得。
符号
XXX:词共现矩阵
XijX_{ij}Xij:单词jjj出现在单词iii的上下文中的次数。
Xi=∑kXikX_i=\sum_kX_{ik}Xi=∑kXik:所有出现在单词iii的上下文中的单词次数。
Pij=p(j∣i)=XijXiP_{ij}=p(j|i)=\frac{X_{ij}}{X_i}Pij=p(j∣i)=XiXij :单词jjj出现在单词iii的上下文中的概率。
举例:
通过观察图中的比率(第三行)可以看出,当结果大于1时,单词kkk与ice更相关,当结果小于1时,单词kkk与steam更相关。
上述论点表明,单词矢量学习的适当起点应该是共现概率的比率而不是概率本身。其中,比率Pik/PjkP_{ik}/P_{jk}Pik/Pjk取决于单词iii、jjj、kkk,我们采用最通用的模型形式:
(1)F(wi,wj,w~k)=PikPjkF(w_i,w_j,\tilde{w}_k)=\frac{P_{ik}}{P_{jk}}\tag{1}F(wi,wj,w~k)=Pj