GloVe :Global Vectors 全局向量模型详解公式推导

最新推荐文章于 2025-08-09 15:57:30 发布

原创

最新推荐文章于 2025-08-09 15:57:30 发布 · 2.2k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#GloVe #NLP

GloVe（Global Vectors）旨在结合矩阵分解和滑窗概率算法的优点，解决词向量表示的问题。通过共现矩阵和概率比值，GloVe发现比率能反映词对之间的内在规律。通过内积和指数函数，建立了词向量的数学模型，并引入权重项f(Xij)优化不同词的重要性。该模型在处理类比问题和全局统计特性上表现出色。

在cs224n Lecture 3: GloVe skipgram cbow lsa 等方法对比 / 词向量评估 /超参数调节总结中，

我们知道，以往生成词向量有两种算法，一种是基于矩阵分解（Matrix Factorization）的，代表有LSA，改进的HAL算法等；一种是基于滑窗概率（Shallow Window）的，代表有Skip-Gram和CBOW。这两种算法，或多或少都存在一些问题，比如，对于矩阵分解的算法而言，其共现矩阵（Co-occurence）是十分庞大的，而对其进行SVD分解，计算更是复杂，得到的词向量无法处理类比（man is to woman as king is to queen）问题；对于滑窗概率算法而言，虽然解决了计算量上的问题，效果不错，但是没有充分利用到语料的全局统计特性。GloVe算法，就是旨在克服上述两种算法的缺点，对优点“结合”了一下。

GloVe算法的如何诞生的？作者是如何想出这个idea的？大致是这样：

既然要用到语料的全局统计特性，那共现矩阵，自然是不能少的了，所以保留了矩阵分解算法的共现矩阵，就像这样：