自然语言处理、文本处理笔记

本文介绍了使用Python的nltk库进行自然语言处理的相关步骤,包括解决nltk下载问题、文本搜索、词频计数、定义函数、频率分布和词语搭配分析等,详细讲解了各部分的操作和函数应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 准备工作

  1. 安装nltk packages

  2. 下载和安装nltk资料库

import nltk
nltk.download()

运行上述命令,发现无法下载,但可以在弹出的界面找到默认安装路径

2 解决 nltk.download() 无法下载语料库的问题

解决办法:本地下载packages存入默认安装路径,也可以存在 D 盘下(python会在好几个默认地址自动寻找packages),存入D:/ 地址下

**如果你无法下载,我存在网盘了
链接:https://pan.baidu.com/s/1jgGyPFKksN1uNPTjnTJaFg
提取码:crg6

下载下来,解压,解压完你会得到一个名为 nltk_data 的文件夹
然后存到 nltk.download() 默认的安装地址 或 D 盘下 。如果你存在 D 盘,你的 D 盘下面会有一个叫 nltk_data 的文件夹, 目录下有这些文件
在这里插入图片描述

上述语料库放好以后,重新打开python(pycharm),运行

from nltk.book import *

出现text
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值