
机器学习
JasonJarvan
这个作者很懒,什么都没留下…
展开
-
python自然语言处理——NLTK——词性标签(pos_tag)
最近在做一个分类40000条推特评论的情感分类器。设计文本情感分类器的时候首先要用到的就是NLTK包来进行单词过滤。先用NLTK包的pos_tag方法(part-of-speech tagging )来对单词的词性进行标记,标记后的结果是二元数组格式。之后从这个二元数列中挑出我们所有需要的tag,存放进一个二元数列。实现代码:首先别忘了import nltk假设我们处理的是like hate这两个...原创 2018-04-16 07:10:52 · 45283 阅读 · 1 评论 -
python自然语言处理——NLTK——词性标签(pos_tag)的字典重构
继续上一篇——词性标签运行代码后,发现问题结果发现,like和hate并没有被加入ret[]。但是like和hate是我们非常重要的情感关键词。原因是like和hate的词性在字典里居然被算作IN和NNa_sentence = 'like hate'token=word_tokenize(a_sentence)pos_tag(word_tokenize(a_sentence))[('like...转载 2018-04-16 08:49:46 · 8489 阅读 · 0 评论