
NLP
藏经阁了知
某知名电商公司AI数据分析师
展开
-
词性标注的词性说明
1. CC Coordinating conjunction 连接词 2. CD Cardinal number 基数词 3. DT Determiner 限定词(如this,that,these,those,such,不定限定词:no,some,any,each,every,enough,either,neither,all,both,ha...转载 2019-03-21 22:28:58 · 868 阅读 · 0 评论 -
NLTK文本预处理与文本分析
本文主要介绍Python中NLTK文本分析的内容,咱先来看看文本分析的整个流程: 原始文本 - 分词 - 词性标注 - 词形归一化 - 去除停用词 - 去除特殊字符 - 单词大小写转换 - 文本分析 一、分词 使用DBSCAN聚类算法的英文介绍文本为例: from nltk import word_tokenize sentence = "DBSCAN - Density-Based Spat...原创 2019-03-22 19:44:47 · 1393 阅读 · 0 评论