
jieba
光英的记忆
新世界,新创造
展开
-
gensim进行LSI LSA LDA主题模型,TFIDF关键词提取,jieba TextRank关键词提取代码实现示例
import gensimimport mathimport jiebaimport jieba.posseg as possegfrom jieba import analysefrom gensim import corpora, modelsimport functoolsimport numpy as np# 停用词表加载方法# 停用词表存储路径,每一行为一个词,按...原创 2019-06-13 11:51:35 · 7899 阅读 · 5 评论 -
jieba分词和高频词提取示例代码
import jiebaimport jieba.analyse as aly# 中文 分词工具jiebasent = '中文分词是文本处理不可或缺的一步!'seglist = jieba.cut(sent, cut_all=True)print("全模式", '/'.join(seglist))# 全模式 中文/分词/是/文本/文本处理/本处/处理/不可/不可或缺/或缺/的/一...原创 2019-06-09 18:41:41 · 2805 阅读 · 1 评论 -
jieba中文词性表注和CRF命名实体识别代码示例
import jiebaimport jieba.posseg as possegimport refrom datetime import datetime,timedeltafrom dateutil.parser import parser# 中文词性标注和命名实体识别sent = "中文分词是文本处理不可或缺的一步!"seglist = posseg.cut(sent)...原创 2019-06-10 20:57:29 · 5812 阅读 · 1 评论