看了这个不完善的demo,它最后效果不算好,因为预处理不够。
应该先分词、去除停用词等再进行Taggeded格式去训练。
Doc2Vec主要是将文本(句子or文章)进行向量转换,将文本转换成一系列向量,之后可以送到机器学习模型中去预测情感啊、计算商品相似度啊...诸如此类的。
https://blog.youkuaiyun.com/juanjuan1314/article/details/75124046/
以上为demo链接,可以非正式地学习一下。博主的留言下有数据集。
感谢!
看了这个不完善的demo,它最后效果不算好,因为预处理不够。
应该先分词、去除停用词等再进行Taggeded格式去训练。
Doc2Vec主要是将文本(句子or文章)进行向量转换,将文本转换成一系列向量,之后可以送到机器学习模型中去预测情感啊、计算商品相似度啊...诸如此类的。
https://blog.youkuaiyun.com/juanjuan1314/article/details/75124046/
以上为demo链接,可以非正式地学习一下。博主的留言下有数据集。
感谢!