
gensim
文章平均质量分 71
Mr_Hagrid
这个作者很懒,什么都没留下…
展开
-
Gensim学习笔记-1--理解corpora.Dictionary
gensim使用python标准的logging包,引入方式为: import logging logging.basicConfig(format=’%(asctime)s : %(levelname)s : %(message)s’, level=logging.INFO) 学习任何开源项目首先都要理解其中的专业术语。 gensim中的必须理解的概念有: 1 raw strings原创 2015-08-17 09:10:30 · 22077 阅读 · 1 评论 -
Gensim学习笔记-2-理解Gensim中的Corpus对象
所有corpora.xxxcorpus中的对象均继承接口 gensim.interfaces.CorpusABC 一个语料库对象(corpus)是一个可迭代的对象,每次迭代得到一篇文档(document) 一个document对象又是一个2元组的(fieldId,fueldValue)序列 不同的corpus有不同的格式和相应的处理方法,但都有继承于CorpusABC的 1 classme原创 2015-08-17 14:27:58 · 6101 阅读 · 0 评论