Python实现文本处理功能,使用jieba库将输入的文章进行中文分词,并统计每个词出现的次数,最后按照出现次数降序输出前N个词及其出现次数。
下面是代码实现:
import jieba
from collections import Counter
def display_words(article, n):
# 对文章进行分词并去除停用词
words = [w for w in
Python实现文本处理功能,使用jieba库将输入的文章进行中文分词,并统计每个词出现的次数,最后按照出现次数降序输出前N个词及其出现次数。
下面是代码实现:
import jieba
from collections import Counter
def display_words(article, n):
# 对文章进行分词并去除停用词
words = [w for w in