利用Python的NLTK 3.0进行自然语言处理技术实践
1. 自然语言处理与NLTK简介
自然语言处理在各个领域都有广泛应用,从谷歌等搜索引擎到Siri等语音接口。Python的自然语言工具包(NLTK)是一套强大的库,成为了原型设计和构建自然语言处理系统的优秀工具之一。
要进行自然语言处理实践,需要准备Python 3和一系列Python包。以下是所需包的列表:
| 包名 | 版本要求 |
| ---- | ---- |
| NLTK | >=3.0a4 |
| pyenchant | >=1.6.5 |
| lockfile | >=0.9.1 |
| numpy | >=1.8.0 |
| scipy | >=0.13.0 |
| scikit-learn | >=0.14.1 |
| execnet | >=1.1 |
| pymongo | >=2.6.3 |
| redis | >=2.8.0 |
| lxml | >=3.2.3 |
| beautifulsoup4 | >=4.3.2 |
| python-dateutil | >=2.0 |
| charade | >=1.0.3 |
还需要NLTK-Trainer,可从链接https://github.com/japerk/nltk-trainer 获取。此外,部分实践会用到MongoDB和Redis这两种NoSQL数据库,可分别从http://www.mongodb.org/ 和h
超级会员免费看
订阅专栏 解锁全文
693

被折叠的 条评论
为什么被折叠?



