nlp
xby_1997
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
gensim:models.ldamodel的第一次使用
参考官网: https://radimrehurek.com/gensim/models/ldamodel.html 小作业说明: 现有3万多行英文论文标题组成的paper.txt,格式为:编号 标题…; 对文本进行5个主题的提取,最后将标题中的每个单词标记到某个主题下。 步骤: 1.对paper.txt进行列表转化,满足输入要求。列表格式:[[’ ‘,’ ‘,’ ‘…],[’ ‘,’ ‘…],[...原创 2019-10-24 20:42:13 · 7267 阅读 · 4 评论 -
NLTK的第一次使用
NLTK(NaturalLanguageToolkit)自然语言处理工具包,在NLP领域中,最常使用的一个Python库。 准备: pip install nltk(并未结束,仍需下载) 对你需要使用的nltk中的包进行下载,例如stopwords,在python环境下,执行:import nltk nltk.download() 出现下载页面,选择你需要的包进行下载即可。 函数: 1.分词:使用...原创 2019-10-15 09:28:16 · 332 阅读 · 0 评论
分享