
自然语言处理
张小杰_2016
这个作者很懒,什么都没留下…
展开
-
自然语言处理-TF-IDF
TF-IDF原理解释:TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。使用场景:用于关键词提取代码实现import jieba.analyse as ana...原创 2020-03-01 23:29:37 · 406 阅读 · 0 评论 -
自然语言处理-词云生成
为什么需要生成词云对于文本数据有个直观的了解,为后续的工作提供一定的数据可视化分析依据。词云的生成步骤:导入工具库读取数据清洗数据统计词频保留前K个词作为词云生成库绘制词云图导入工具库import warningswarnings.filterwarnings('ignore')import jiebaimport numpyimport pandas as pdi...原创 2020-03-01 23:03:45 · 1308 阅读 · 0 评论