StanfordTokenizer提示找不到stanford-postagger.jar

 提示如下错误,

LookupError:

===========================================================================
  NLTK was unable to find stanford-postagger.jar! Set the CLASSPATH
  environment variable.

  For more information, on stanford-postagger.jar, see:
    <http://nlp.stanford.edu/software/tokenizer.shtml>
===========================================================================

解决思路:

打开 StanfordTokenizer 定义发现默认的 path_to_jar 为 _JAR = 'stanford-postagger.jar'。

解决方法:

从连接下载源文件,https://nlp.stanford.edu/software/stanford-postagger-full-2017-06-09.zip

或通过wget https://nlp.stanford.edu/software/stanford-postagger-full-2017-06-09.zip下载。

解压之后,将stanford-postagger.jar所在路径传递给StanfordTokenizer即可,即

MyTokenizer = StanfordTokenizer(path_to_jar = path)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值