
Lucene全文检索技术
iteye_15368
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
lucene 使用与优化
1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文...2008-07-02 14:03:36 · 98 阅读 · 0 评论 -
深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。 在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住...2008-07-03 10:03:44 · 118 阅读 · 0 评论 -
Lucene 中文分词
[url=http://www.solol.org/technologic/java/j-lucene/]查看原文[/url] Apache Lucene作为一个开放源码的搜索软件包应用越来越广泛,但是对于中文用户来说其提供的两个中文分词器(CJKAnalyzer、ChineseAnalyzer)的功能又太弱了。所以迫切需要开发自己的中文分词器,而开发适用的分词器是一项很有挑战的工作。我想在文章...2008-07-03 10:17:16 · 133 阅读 · 0 评论 -
构建基于词典的Lucene分析器
Lucene是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包。但是对于绝大多数中文用户来说其提供的两个中文分析器(ChineseAnalyzer和CJKAnalyzer)的能力又太弱了,因此我们有必要开发适合自己的中文分析器。这篇文章中给出了一个基于词典的简单的实现。 实现这个中文分析器的过程就像是一场精彩的赛事。好了,让我们马上开始。 冗长的代码常常...2008-07-03 10:22:58 · 105 阅读 · 0 评论 -
lucene2.0学习文档
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,api也很简单。总得来说用Lucene来进行建立和搜索与操作数据库是差不多的,Document可以看作是数据库的一行记录,Field可以看作是数据库的字段。用lucene实现搜索引擎就像用JDBC实现连接数据库一样简单。 值得一提的是:2006年6月1号Lucene2.0发布,它与以前广泛应用...2008-07-03 11:52:39 · 135 阅读 · 0 评论 -
全文检索lucene学习笔记(四)
[url=http://blog.youkuaiyun.com/kunshan_shenbin/archive/2008/06/04/2510405.aspx]关于Lucene七个查询的使用[/url] 1.TermQuery: [code="java"]package com.lucene.search; import java.io.File; import java.io.IOExc...2008-07-05 10:45:18 · 110 阅读 · 0 评论 -
Lucene 全文检索实践
[url=http://www.lucene.com.cn/sj.htm]在这里,我们将对 HTML 文件生成索引,然后通过一个 JSP 对其进行全文检索。[/url] 生成索引 [code="java"]/** * PHPDocIndexer.java * 用于对 PHPDoc 的 HTML 页面生成索引文件。 */ import java.io.File; import...2008-07-05 11:10:12 · 132 阅读 · 0 评论 -
Lucene 小试牛刀 代码实现
一, 建立索引,根据索引进行搜索 [code="java"]package com.xbkj.business.demo.lucene; import java.io.File; import java.io.FileReader; import java.io.IOException; import java.io.Reader; import java.util.Array...2008-07-10 16:22:45 · 114 阅读 · 0 评论