https://www.cnblogs.com/eniac1946/p/8818892.html
参考:https://www.cnblogs.com/eniac1946/p/8818892.html
基于Hierarchical Softmax的CBOW模型
构造 P(w | context(w))
哈夫曼树(Huffman Tree)
又称为带权路径长度最短二叉树,或最优二叉树。如A:15,B:10,C:3,D:5,下图所示为哈夫曼树:
带权路径长度WPL=33+53+102+151=59。
在CBOW中,输出层为一棵根据词频构造的哈夫曼树。
其实在word2vec之前,即有类似的三层神经网络结构做词向量模型,一点很大的不同是,之前的方法输出层是一个softmax层,从隐藏层到输出层即需要计算所有词的softmax概率,计算量很大,而输出层为哈夫曼