
搜索引擎
jinansunge
不是很有感觉的程序员立志要做个专业的程序员,程序员进行中....
展开
-
lucene 2.4.0 api url
<br />http://lucene.apache.org/java/2_4_0/api/index.html原创 2010-10-07 21:15:00 · 250 阅读 · 0 评论 -
中科院分词工具官网
<br />http://www.ictclas.org/ 使用C++开发,java需要在静态初始化段中夹杂该dll.原创 2010-10-13 00:28:00 · 345 阅读 · 0 评论 -
JE分词
http://www.jesoft.cn/原创 2010-10-13 00:31:00 · 190 阅读 · 0 评论 -
Lunece 与 分布式
<br />GFS(Google File System)原创 2010-10-14 00:14:00 · 156 阅读 · 0 评论 -
将大文档按一定大小分割成小文件
public static void splitToSmallFiles(File file, String outputpath)throws IOException {int filePointer = 0;int MAX_SIZE = 10240;BufferedWriter writer = null;BufferedReader reader = new BufferedReader(new FileReader(file));StringBuffer buffer = new StringBuf原创 2010-10-24 16:30:00 · 200 阅读 · 0 评论 -
将文档全角标点转成半角标点方法
private static String replace(String line) {HashMap map = new HashMap();map.put(",", ",");map.put("。", ".");map.put("〈", "map.put("〉", ">");map.put("‖", "|");map.put("《", "map.put("》", ">");map.put("〔", "[");map.put("〕", "]");map.put("﹖", "?");map.put("?",原创 2010-10-24 16:28:00 · 739 阅读 · 0 评论