用Python进行自然语言处理 - 语言处理与Python

本文记录了使用Python的Natural Language Toolkit (NLTK)进行自然语言处理的学习过程,包括NLTK的安装、数据下载,以及使用NLTK进行词汇搜索、上下文相似性分析等基本操作。同时,文章提供了相关练习的解答,帮助读者巩固概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在看《Analyzing Text with the Natural Language Toolkit》的中文翻译版本,觉得蛮有意思的,就把学习过程中的遇到的问题和一些代码的运行结果记录下来。小白一只,如有错误,请您指正,谢谢!

想要这本书资源的可以在评论区留下您的邮箱。

下面进入正题(之前我已经装好了Python3.6版本):

第1章    语言处理与Python

1.1 语言计算:文本和单词


  • NLTK入门    

       由于pip版本太老,先右键管理员身份打开cmd,根据提示输入 python -m pip install --upgrade pip 语句进行pip的更新。

       更新完毕,输入 pip install nltk 语句进行NLTK的安装。

       安装完毕,启动Python解释器。在Python提示符后输入以下命令:

                                                   >>>import nltk

                                                   >>>nltk.download()

       跳出以下界面:

       选中“book”这一行,点击“Download”。完成后,出现如下界面:

 

        关闭窗口。此时数据已经被下载到电脑上啦,你可以使用Python解释器去加载一些要用的文本。

        首先输入 from nltk.book import * ,即从NLTK的book模块加载all。

        若想找到这些文本,只需在>>>后输入它们的名字即可。如:


  •  搜索文本

        text1.concordance("monstrous") 即搜索《白鲸记》中的词monstrous:

         text2.concordance("affection") 即搜索《理智与情感》中的词affection:

评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值