关键词提取
移除标点符号一般有两种方法:删除停止词(Stop Words);
根据词性提取关键词。
words2 = jieba.cut(words1)
words3 = list(words2)
print("/".join(words3))
# 速度/快/,/包装/好/,/看着/特别/好/,/喝/着/肯定/不错/!/价廉物美
stop_words = [",", "!"]
words4 =[x for x in words3 if x not in stop_words]
print(words4)
# ['速度', '快', '包装', '好', '看着', '特别', '好', '喝', '着', '肯定', '不错', '价廉物美']

最低0.47元/天 解锁文章
737

被折叠的 条评论
为什么被折叠?



