本文用gensim实践doc2vec,并与word2vec均值得到的词向量 在IMDB数据集情感分类任务中进行比较。
完整代码见 https://github.com/FlyingLittlePigJoy/word_embedding
由分析结果可知:在此情感分类数据集中(数据来源于参考博客),doc2vec对文档内容或情绪的表示效果还是很不错的。
参考博客:http://linanqiu.github.io/2015/10/07/word2vec-sentiment/
doc2vec paper: http://proceedings.mlr.press/v32/le14.pdf

本文通过gensim实现doc2Vec,并将其与Word2Vec在IMDB情感分类任务上进行比较。实验结果显示,在该情感分类数据集上,doc2Vec能够较好地捕捉文档内容及情绪特征。
1970

被折叠的 条评论
为什么被折叠?



