(六)文本挖掘——名词提取

# @Time : 2021/3/16 19:54
# @Author : chao

#名词提取
from collections import Counter

f1 = open(r'C:\Users\代码\去除停用词并分词\去除停用词并分词结果\zong_fengci_tingyongci2.txt',
          'r', encoding='utf-8')
#构建一个空列表,用以保存提取出的每个词
words = []
#构建一个空列表,用于保存提取出的名词
ming_words = []
for i in f1.readlines():
    #print(i.replace('x','').split(" "))
    line = i.split(" ")
    for j in line:
        if(j!='' and j!='\n' and j!='x'):
            words.append(j)
#提取名词
for i in words:
    #if('n' in i):
        ming_words.append(i)

#统计词频
counter = Counter(ming_words)
dictionary=dict(counter)
# get to k most frequently occuring words
k=100
res=counter.most_common(k)
print(res)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值