NLTK异常问题 [nltk_data] Error loading reuters: <urlopen error [Errno 11004] [nltk_data] getaddrinfo

[nltk_data] Error loading reuters: urlopen error [Errno 11004] [nltk_data] getaddrinfo failed

在学习NLP项目时,经常会用到nltk工具包,但经常在import后使用的时候出现报错的情况
在这里插入图片描述
我们可以看到在错误提示里有让我们去download(‘reuters’)
但是按照提示的方法去下载时会报如下错误

import nltk
nltk.download('reuters')

在这里插入图片描述

出现这样的问题时要怎么解决?很多人都走错了思路导致浪费了不少时间在这上面。
主要的原因是无法解析raw.githubusercontent.com这个域名,这时我们可以使用代理的方式去连接到这个地址,或者修改host文件的域名地址映射,或者手动下载后解压到指定目录,详情如下:

解决办法

1.设置系统代理

把nltk.download()替换为:

nltk.set_proxy('SYSTEM PROXY')
nltk.download()

2.修改host文件

在 C:\Windows\System32\drivers\etc 路径下找到hosts文件,并在最后添加 199.232.68.133 raw.githubusercontent.com IP地址,并保存

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值