NLP之路-warm up

本文通过使用NLTK库进行了一系列的文本处理实验,包括提取包含特定格式或内容的词汇等,旨在展示如何利用Python进行自然语言处理的基础操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天继续做了一些小的尝试,算作技术铺垫。


from nltk.book import *
print("*****import nltk.book OK")

print(sorted([w for w in set(text7) if '-'in w and 'index' in w]))
print('\n')
print(sorted([wd for wd in set(text3) if wd.istitle() and len(wd)> 10]))
print('\n')
print(sorted([w for w in set(sent7) if not w.islower()]))
print('\n')
print(sorted([t for t in set(text2) if 'cie' in t or 'cei'in t]))
print('\n')

for xyzzy in sent1:
     if xyzzy.endswith('l'):
         print xyzzy 

for token in sent1:
    if token.islower():
        print token, 'is a lowercase word'
    elif token.istitle():
        print token, 'is a titlecase word'
    else:
        print token, 'is punctuation' 

#请注意 print 语句结尾处的逗号,它告诉 Python在同一行输出。
tricky = sorted([w for w in set(text2) if 'cie' in w or 'cei' in w])
for word in tricky:
     print word,


和机器人对话


import nltk
nltk.chat.chatbots()



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值