1、Gensim:主题模型,计算文本相似度
官网:https://radimrehurek.com/gensim/
学习教程:https://www.cnblogs.com/iloveai/p/gensim_tutorial.html
pip install gensim
(1)用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达,支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法
(2)支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口
2、Fancy-NLP:是腾讯商品广告策略组团队构建的,用于建设商品画像文本知识挖掘工具,支持如:实体提取、文本分类和文本相似度匹配等多种常见nlp任务。能够支持用户快速实现相关功能,比如说快速挖掘商品特征,应用到支持广告商品推荐模块种。
pip install fancy-nlp