nltk_data下载包
链接:https://pan.baidu.com/s/1K2PxZn6_-EULGDwY9YnClg
提取码:u4w2
使用anaconda打开Prompt
如果没有anaconda可以直接使用win+r打开命令提示符,输入cmd进行命令提示框操作。
anaconda和pip安装应该都可以,我是使用anaconda安装的。
打开命令提示框输入以下代码即可快速下载nltk
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ nltk
下载之后要接着下载nltk_data下载包才能使用nltk,下载包在文章开头有链接
打开创建的环境,输入python
python输入之后再输入下面代码
import nltk
from nltk.book import *
会出现以上安装目录,将nltk_data下载包放到任意目录下即可,目录下要将文件夹命名为nltk_data,然后讲nltk_data压缩包放到该文件夹下解压。
接着要将nltk_data下tokenizers里的punkt解压,如果不解压word_tokenize运行就会出现问题
最后我们来测试一下代码
from nltk import word_tokenize
import random
# 打招呼
greetings = ['hola', 'hello', 'hi', 'Hi', 'hey!','hey']
# 回复打招呼
random_greeting = random.choice(greetings)
# 对于“假期”的话题关键词
question = ['break','holiday','vacation','weekend']
# 回复假期话题
responses = ['It was nice! I went to Paris',"Sadly, I just stayed at home"]
# 随机选一个回
random_response = random.choice(responses)
# 机器人跑起来
while True:
userInput = input(">>> ")
# 清理一下输入,看看都有哪些词
cleaned_input = word_tokenize(userInput)
# 这里,我们比较一下关键词,确定他属于哪个问题
if not set(cleaned_input).isdisjoint(greetings):
print(random_greeting)
elif not set(cleaned_input).isdisjoint(question):
print(random_response)
# 除非你说“拜拜”
elif userInput == 'bye':
break
else:
print("I did not understand what you said")
能够运行,证明安装成功