
搜索引擎
文章平均质量分 78
fushengfei
这个作者很懒,什么都没留下…
展开
-
lucene的简单使用
1、下载地址:http://archive.apache.org/dist/lucene/java/ 2、往项目中导入相关包。 3、构建第一个lucene项目,该项目的功能是把文档进行索引,索引之后进行搜索。 4、代码: HelloWord.java public class HelloWord { String filePath...原创 2010-10-15 14:53:21 · 105 阅读 · 0 评论 -
lucene学习笔记
1、工具类 import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import org.apache.lucene.document.Document; import org.apac...原创 2010-11-10 15:25:00 · 88 阅读 · 0 评论 -
nutch中文分词(修改源码的方式)
1、需要的jar包 je-analysis-1.5.3.jar javacc工具 ant 2、部署nutch工程到eclipse中,这一步网上有很多的参考。 3、nutch工程部署好后直接修改org.apache.nutch.analysis包下面的NutchDocumentAnalyzer.java的 tokenStream方法 即将以下代码 /**...原创 2010-11-19 15:40:59 · 153 阅读 · 0 评论 -
nutch中文分词(通过插件的方式)
1、需要的工具:IKAnalyzer jar包(将其命名为analysis-zh.jar) javacc工具 ant 2、部署nutch工程到eclipse中。 3、定义自己的分词类,代码如下 package com.gpower.nutch.plugin; import java.io.Reader; import org.apa...原创 2010-11-19 16:11:15 · 177 阅读 · 0 评论