
nlp
文章平均质量分 79
骉码
日进一步
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python利用nltk工具,数文件夹中所有文本文件的频率最高的单词
Life is tooooo short , you need python. 这两天看了下nltk(Natural Language Processing Toolkit)工具包,在感受着其强大功能的时。An idea comming ,既然这是一个工具,那能不能真正的用起来了。那么前段时间看到晚上一些关于统计字符的样题,不是可以完美匹配嘛。下面是一个小样例:from nltk impor...原创 2018-07-04 19:29:50 · 918 阅读 · 1 评论 -
jieba 分词 入门小笔记
import jieba juzi1 = "你妈妈喊你回家吃饭啦!你在干嘛,怎么还不回家?" #jieba.add_word("还不")jieba.add_word("还不")seg_list = jieba.cut(juzi1,cut_all = False)text = " ".join(seg_list) print(text)不加自定义词你 妈妈 喊 你 回家 吃饭 啦 ! 你 在 干嘛 ...原创 2018-07-04 20:57:58 · 348 阅读 · 0 评论