
Lucene
iteye_15928
这个作者很懒,什么都没留下…
展开
-
Lucene2.0检索方式
取得检索信息: 方式一: for(HitIterator iter=(HitIterator)hits.iterator();iter.hasNext();){ Hit hit=(Hit)iter.next(); //Document doc=hit.getDocument(); hit.get("title"); hit.get("body"); } 方式二: for(int i=0;i Doc...2007-01-04 16:43:45 · 135 阅读 · 0 评论 -
Lucene之Field
doc.add(new Field("file",file.getName(),Field.Store.YES,Field.Index.NO)); //doc.add(Field.UnIndexed("file", file.getName())); 后者在lucene的后续版本中找不到了,可能是被抛弃的方法吧.现在用上面的方法代替. org.apache.lucene.analysis包 or...2007-01-04 16:49:43 · 126 阅读 · 0 评论 -
Lucene文件格式
生成的文件如下: _21.f1,_21.f2,依次类推,扩展名根据文件排序; _21.fdt; _21.fdx; *.fdt和*.fdx构成了域值存储表; _21.fnm; 记录了域集合信息; _21.frq; 记录了项的位置; _21.prx; 记录了项频数; _21.tii; _21.tis; *.tii和*.tis构成了项字典; segment1.nrm 记录了标准化因子; segment...2007-03-08 16:22:17 · 147 阅读 · 0 评论 -
lucene之分词,索引,存储
全文检索(lucene): 刚接触lucene时,对分词,索引,存储不是很了解,经过深入的学习,逐渐连接了这三个的概念; 1,分词:就是剔除掉常见到词(当然这里可以自定义那些要被剔掉的词),如"我是java程序员,我用eclipse开发java",一般 人搜索不会输入"我","用","开发"这些词,我们把它们剔除掉,就剩下"java","程序员","eclipse",&2007-03-21 14:57:49 · 535 阅读 · 0 评论