推荐领域(DSSM双塔模型):
https://www.cnblogs.com/wilson0068/p/12881258.html
word2vec
上面这两个链接能让你彻底明白word2vec,不要搞什么公式,看完也是不知所云,也没说到本质.
目前用的比较多的都是Skip-gram模型
Google 于 2013 年开源推出的一个用于获取 word vector 的工具包(word2vec),并且简单的介绍了其中的两个训练模型(Skip-gram,CBOW),以及两种加速的方法(Hierarchical Softmax,Negative Sampling)
学习word2vec的skip-gram实现,除了skip-gram模型还有CBOW模型。
Skip-gram模式是根据中间词,预测前后词,CBOW模型刚好相反,根据前后的词,预测中间词。
那么什么是中间词呢?什么样的词才叫做前后词呢?
首先,我们需要定义一个窗口大小,在窗口里面的词,我们才有中间词和前