接上节课没讲完的word2vec
word2vec(续)
训练策略:
SGD


Word2vec使用SGD训练存在的问题:
每次只有窗口内的词会参与训练,梯度矩阵太稀疏,训练效率低。


优化方法:
1.negative sampling
转化为二分类问题



2.hierarchical softmax
Glove



公式推导参考这里
词向量评估



词向量存在的问题
多义词

接上节课没讲完的word2vec
SGD
每次只有窗口内的词会参与训练,梯度矩阵太稀疏,训练效率低。
1.negative sampling
转化为二分类问题
2.hierarchical softmax
公式推导参考这里
多义词