
文字处理
petblue
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Java处理重复,重复的元素只保留一个。
一、第一个类。读取文字存储在LinkedList中,通过它的contains方法判断是否重复,重复不处理,不重复则加入。 package com.aawant.nlp.filehandle; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.原创 2015-05-05 13:42:06 · 3620 阅读 · 0 评论 -
TFIDF算法,java代码实现
TFIDF算法,java代码实现TF-IDF算法全称为term frequency–inverse document frequency。TF就是term frequency的缩写,意为词频。IDF则是inverse document frequency的缩写,意为逆文档频率。 package com.aawant.nlp.featureExtraction.tfidf;import java.i原创 2015-05-05 16:09:32 · 7257 阅读 · 0 评论