注意:NLTK只能应用于英文,中文不行
1、 基于NLTK的命名实体识别(分词、词性标注)
2、 windows系统64位—在python3下安装nltk
windows系统64位—在python3下安装nltk(参考链接:https://blog.youkuaiyun.com/llx1026/article/details/78034238)
在网上找了各种安装教程,都没有在python3下安装nltk,于是我自己尝试着安装,算是成功了
1、首先,假设你的python3已经安装好,并且安装了numpy,matplotlib,pandas一些常用的库,当你安装nltk时,我相信你一定具备了一些python的常用技能,所以默认你已经安装了以上常用模块
2、然后,用cmd打开电脑终端,然后输入pip install pyyaml nltk,这样既安装了PyYAML模块,又安装了nltk模块
3、 打开python脚本程序,输入:import nltk,看nltk是否导入成功。
4、(网上说需要这一步,自己在做的时候发现不要这一步也可以运行)
如这样你以为nltk就安装成功了那么你就大错特错了,因为还有一步,如果最后一步忽略的话,那么你在用nltk的时候会出现很多错误,具体出现什么样的错误,额额额额额我忘记截图了,后来运行成功后就没有错误了
打开python脚本程序,输入:
importnltk
Nltk.download()
运行,在出现的窗口中点击download,然后等待下载即可。
用小程序测试基于NLTK的命名实体识别(分词、词性标注)
(参考链接:https://blog.youkuaiyun.com/babydx/article/details/77836810)
直接贴上代码:(python3.6版本)
1. Python2.7:reload(sys)
2. sys.setdefaultencoding('utf8')