nltk练习题

这篇博客探讨了如何利用nltk库进行自然语言处理的实践操作,重点关注了检查词汇表是否为文本子集的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.制作《理智与情感》中四个主角:Elinor,Marianne,Edward 和Willoughby 的分布图。
在这部小说中关于男性和女性所扮演的不同角色,你能观察到什么?你能找出一对夫妻

吗?

text2.dispersion_plot(["Elinor", "Marianne", "Edward", "Willoughby"])

2.使用的语法my_sent = ["My", "sent"],定义一个词链表变量my_sent(用你
自己的词或喜欢的话)。
a. 使用' '.join(my_sent)将其转换成一个字符串。
b. 使用split()在你指定的地方将字符串分割回链表。

"".join(my_sent)
 my_string.split()

3.我们已经看到如何用词链表表示一个句子,其中每个词是一个字符序列。sent1[2][2]
代表什么意思?
phrase1=["ni","hao","ma"]
 phrase1[1][0]
 'h'
4.聊天语料库(text5)中查找所有以字母b 开头的词。
按字母顺序显示出来。

 sorted([w for w in set(text5) if w.startswith('b')])

5.使用text9.index()查找词sunset 的索引值。你需要将这个词作为一个参数插入到圆
括号之间。通过尝试和出错的过程中,找到完整的句子中包含这个词的切片。

text9.index("sunset")
629
text9[620:640]
6.使
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值