
Lucene
comliu
这个作者很懒,什么都没留下…
展开
-
一个辅助Lucene对数字类型进行索引和搜索的工具类
在《Lucene in action》2.5 Indexing numbers 中提到,如果希望对数据类型进行搜索,在创建索引的时候要采用KeyWord类型的Field,对应到Lucene2.0,就是: new Field("field",number,Field.Store.YES,Field.Index.UN_TOKENIZED) 但是在进行这一原创 2006-12-23 17:19:00 · 2700 阅读 · 0 评论 -
《Lucene in action》中推荐的Lucene分页方式
在《Lucene in action》 中专门讨论了如何对Hits进行分页,提供了两条路:一是在用户进行分页导航的过程中保持Hits和IndexSearcher的可用状态,也就是说不能在搜索之后关闭IndexSearcher,并且还要将Hits保存到Session中。而推荐的做法是为每一次分页导航都执行一次新的查询。因为Hits中保存的并不是真正的Document,因此可以通过HI原创 2006-12-23 17:38:00 · 6130 阅读 · 4 评论 -
Lucene的平行索引
有时对于一个Document来说,有一些Field会被频繁地操作,而另一些Field则不会。这时可以将频繁操作的Field和其他Field分开存放,而在搜索时同时检索这两部分Field而提取出一个完整的Document。 这要求两个索引包含的Document的数量必须相同。 在创建索引的时候,可以同时创建多个IndexWriter,将一个Document根据需要拆原创 2006-12-31 12:58:00 · 951 阅读 · 0 评论 -
Lucene同时搜索多个索引
在创建索引的时候可以根据分类需要创建多个索引,而在搜索时可以同时搜索所有的索引。 这一功能通过MultiSearcher实现。 IndexSearcher[] searchers=new IndexSearcher[]{new IndexSearcher(dir1),new IndexSearcher(dir2)}; MultiSearcher m原创 2006-12-31 13:04:00 · 1544 阅读 · 0 评论 -
一个使用Neko提取HTML纯文本内容的程序例子
import org.apache.html.dom.HTMLDocumentImpl;import org.cyberneko.html.parsers.DOMFragmentParser;import org.w3c.dom.Document;import org.w3c.dom.Node;import org.w3c.dom.DocumentFragment;import org.w3c.d原创 2007-02-13 13:00:00 · 3770 阅读 · 1 评论