NLTK的安装

本文介绍了自然语言处理工具包NLTK的安装与基本使用方法,包括如何通过pip安装NLTK,使用sent_tokenize和word_tokenize进行句子和单词的分割,以及使用pos_tag进行词性标注。同时,针对在Linux环境下安装后遇到的错误提供了解决方案。

一、NLTK:Natural Language Toolkit(自然语言工具包)

 下载:http://www.nltk.org

pip install nltk

二、使用

import nltk
nltk.download()#下载数据

import nltk

text = 'Hello, Tom! How are you recently?'

sens = nltk.sent_tokenize(text) #对文本按照句子进行分割
sens#['Hello, Tom!', 'How are you recently?']

words = []
for sen in sens:
    words.append(nltk.word_tokenize(sen))#对句子进行分词

words#[['Hello', ',', 'Tom', '!'], ['How', 'are', 'you', 'recently', '?']]

tags = []

for tokens in words:
    tags.append(nltk.pos_tag(tokens))#对句子进行词性标注
tags#[[('Hello', 'NNP'), (',', ','), ('Tom', 'NNP'), ('!', '.')], [('How', 'WRB'), ('are', 'VBP'), ('you', 'PRP'), ('recently', 'RB'), ('?', '.')]]

 

三、安装成功,导入报错

 已经成功安装nltk,但是import nltk时报错:No module named '_sqlite3'

 背景:linux系统自带的python2,已经成功安装nltk,本人自己安装了python3,import nltk出错

 解决方法:sudo apt-get install  sqlite*之后,重新安装python3

#step1
sudo apt-get install  sqlite*

#step2
./configure --prefix=/python3_path
make && make install

 

 

 

 

 

转载于:https://www.cnblogs.com/always-fight/p/9779997.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值