
gensim
光英的记忆
新世界,新创造
展开
-
gensim安装 文本主题模型代码示例
https://github.com/RaRe-Technologies/gensimpip install -U gensim代码示例import nltkfrom nltk import collectionsfrom nltk.corpus import stopwordsfrom nltk.stem import WordNetLem...原创 2019-05-26 20:55:36 · 332 阅读 · 0 评论 -
gensim进行LSI LSA LDA主题模型,TFIDF关键词提取,jieba TextRank关键词提取代码实现示例
import gensimimport mathimport jiebaimport jieba.posseg as possegfrom jieba import analysefrom gensim import corpora, modelsimport functoolsimport numpy as np# 停用词表加载方法# 停用词表存储路径,每一行为一个词,按...原创 2019-06-13 11:51:35 · 7899 阅读 · 5 评论 -
gensim的安装
第一次没找到,再试一次就找到了 ,有可能网络不太好原创 2019-06-10 22:32:09 · 990 阅读 · 0 评论 -
wiki中文文本语料下载,在维基百科中文语料训练Word2vec and doc2vec 文本向量化代码示例
首先下载wiki中文语料(大约1.7G)https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2下载的文件名为“zhwiki-latest-pages-articles.xml.bz2”这个大家都知道,然后没什么卵用,因为墙太强大,所以下载不下来,只能另辟蹊径了。。。因此搜来搜去找到2...原创 2019-06-16 16:26:40 · 8216 阅读 · 2 评论