注意,三个模型的关系不是简单的堆叠,区别很大
word2vec
出现最早,针对词,词粒度不限,大量文本训练,
通过训练,得到词嵌入向量。
doc2vec
在word2vec后出现,针对词和句子(或者词和段落,或者词和文章),粒度自定义,大量文本训练,与word2vec统一水平,借鉴了word2vec的训练思想
sentence2vec
三个模型中出现最晚,针对句子,粒度是自然句子,大量文本训练。
在word2vec的基础上的模型,纯粹只找句子向量,
原文思想不复杂,通过引入 discourse(我不理解这是什么),然后加一些权东西,通过计算出似然函数的方法得到一个结果,这个结果只对词向量权重。
不从头看到尾,不多看几遍有几个地方是看不懂的,用到了PCA之类的矩阵计算。
可以看https://blog.youkuaiyun.com/promisejia/article/details/88364569的介绍。