目录
一.使用NLTK库遇到的问题
我在前文的使用中遇到了以下的问题,以此记录解决办法并学习相应知识。
# 下载停用词资源
import nltknltk.download('stopwords')
报错如下:
二.解决办法之一
1. 参考提示
https://www.nltk.org/data.html
这个链接很好,很喜欢这种报错了会提示你去哪里找答案的方式。里面写的很清楚,稍微动点脑袋的我找到了解决办法。我采用的是手动下载后加入到机器,由于我前面执行过安装nltk且成功安装,所以我一直在找nltk_data在我机器上的路径,耗费了不少时间,这里是个踩坑点。通过该链接中的一句话,让我反应过来了,当我没找到时我可以在以下目录自己创建一个。
2. 下载资源
http://www.nltk.org/nltk_data/
先去下载需要的资源,解压后放到Searched in里面的任意一个路径下,比如我需要的是stopwords,然后设置的路径如下:
/usr/share/nltk_data/corpora/stopwords
由于需要使用到其他功能,所以我准备安装所有资源,该地址可下载所有资源:https://github.com/nltk/nltk_data
安装所有资源时,报了如下错,网上也有人有该问题,做下记录,
原因是punkt_tab这个是压缩包,解压缩就好了。还会遇到类似的问题的举一反三。