下面用几幅图对比我们的算法与清华NLP实验室的算法结果:
清华



Chindle的效果(非同一个账号):



Chindle的算法很简单:
1、分词
2、stopword过滤
3、词性过滤(只留下名词和形容词)
4、按照频率排序,去掉出现频率特别高的词汇(出现了10次以上)
本文通过几幅图对比了我们的算法与清华NLP实验室Chindle算法的效果。Chindle算法流程包括分词、stopword过滤、词性过滤(保留名词和形容词)及按频率排序并去除高频词(出现10次以上)。
下面用几幅图对比我们的算法与清华NLP实验室的算法结果:
清华



Chindle的效果(非同一个账号):



Chindle的算法很简单:
1、分词
2、stopword过滤
3、词性过滤(只留下名词和形容词)
4、按照频率排序,去掉出现频率特别高的词汇(出现了10次以上)
1194

被折叠的 条评论
为什么被折叠?