1、TFIDF的运用,如算出每个文档中单词的TFIDF后,比较大小,直接加权或者取TopN.这个可以自己写也可以用工具sklearn.(不过使用中文时注意上篇中提到的注意事项)
2、主题模型方法,使用gensim中的LDA等
最后使用词云工具如pyTagcloud进行可视化展示
1、TFIDF的运用,如算出每个文档中单词的TFIDF后,比较大小,直接加权或者取TopN.这个可以自己写也可以用工具sklearn.(不过使用中文时注意上篇中提到的注意事项)
2、主题模型方法,使用gensim中的LDA等
最后使用词云工具如pyTagcloud进行可视化展示