- 博客(1)
- 收藏
- 关注
原创 文本预处理——TF-IDF
1 TF-IDF定性描述 ####TF-IDF是Term Frequency - Inverse Document Frequency的缩写,即意思为“词频-逆文本频率”,主要由两个部分组成:TF和IDF。 ####第一个部分TF即我们说到的词频,也就是这个词语在文本中出现的次数,统计文本中每个词出现的次数,做频率统计,并且作为文本的特征。 ####第二个部分是IDF,即逆文本频率,这个该如何理解...
2019-04-10 12:13:34
326
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人