lucene
文章平均质量分 90
summer85
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
lucene分页
转载原创地址: http://qindongliang1922.iteye.com/blog/1931191 散仙在上篇文章中,总结了几个Lucene的特殊的分词需求,以及怎么定制我们自己的Tokenizer和Analyzer用来处理他们,那么本篇我们依旧是分析用户需求(哈哈,也不算是用户需求,群里面(324714439)朋友们提问的问题),然后找到最合适的解决方法。 我们先来看下下面的问题,现...原创 2014-02-10 10:52:14 · 212 阅读 · 0 评论 -
lucene排序
原文http://qindongliang1922.iteye.com/blog/1924608 排序是对于全文检索来言是一个必不可少的功能,在实际运用中,排序功能能在某些时候给我们带来很大的方便,比如在淘宝,京东等一些电商网站我们可能通过排序来快速找到价格最便宜的商品,或者通过排序来找到评论数最高或卖的最好的商品,再比如在Iteye里的博客栏里,每天都会以降序的方式,来显示出最新发出...原创 2014-02-10 10:53:42 · 314 阅读 · 0 评论 -
lucene的Filter
原文http://qindongliang1922.iteye.com/blog/1934607 散仙今天要写的是关于过滤方面的知识,也就是Filter,如果了解Solr的朋友们,肯定都会知道Solr里面fq这个参数,这个参数的作用其实就是lucene里面的过滤,对一些q参数查询的结果集,做过滤或者限制返回一些我们需要的内容,可以理解成缩小搜索空间的一种策略。 在这里散仙先介绍下查询与...原创 2014-02-10 11:36:05 · 175 阅读 · 0 评论 -
用Lucene构建实时索引的文档更新问题
1、Lucene删除文档的几种方式 IndexReader.deleteDocument(int docID)是用 IndexReader 按文档号删除。 IndexReader.deleteDocuments(Term term)是用 IndexReader 删除包含此词(Term)的文档。 IndexWriter.deleteDocuments(Term term)...原创 2014-03-14 14:01:06 · 245 阅读 · 0 评论 -
Lucene的事务性
所谓事务性,本多指数据库的属性,包括ACID四个基本要素:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。我们这里主要讨论隔离性,Lucene的IndexReader和IndexWriter具有隔离性。当IndexReader.open打开一个索引的时候,相对于给当前索引进行了一次snapshot,此后的任何...原创 2014-03-14 15:52:09 · 135 阅读 · 0 评论 -
用Lucene构建实时的索引
Lucene的事务性,使得Lucene可以增量的添加一个段,我们知道,倒排索引是有一定的格式的,而这个格式一旦写入是非常难以改变的,那么如何能够增量建索引呢?Lucene使用段这个概念解决了这个问题,对于每个已经生成的段,其倒排索引结构不会再改变,而增量添加的文档添加到新的段中,段之间在一定的时刻进行合并,从而形成新的倒排索引结构。然而也正因为Lucene的事务性,使得Lucene的索引不够...原创 2014-03-14 16:52:47 · 137 阅读 · 0 评论 -
lucene的一些基本知识点记录(转)
Lucene可能生成这几种文件:Segments 这个文件记录着索引的有多少个segment,每个segment有多少个Document等信息Deletable 这个文件记录着删除的Document信息,这里就相当于一个回收站,只有等到合并索引或者对索引进行优化时才真正把Document删除掉。这些动作就相当于我们针对回收站执行删除操作彻底删除文件一个道理.*.fnm 这个是保存了...原创 2014-04-14 19:44:38 · 201 阅读 · 0 评论 -
lucene-内存索引、内存索引保存在硬盘、索引优化
索引代码package bindex;import jeasy.analysis.MMAnalyzer;import org.apache.lucene.analysis.PerFieldAnalyzerWrapper;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene....原创 2014-04-14 19:46:45 · 457 阅读 · 0 评论 -
Lucene_demo05_内存索引和文件索引
内存索引库:数据是临时的、访问速度比文件索引库要快、索引库中的数据不能存放太多、内存索引库和文件索引库能结合在一起 两个或者两个以上的索引库的合并: 如果是内存索引库,直接调用构造函数进行合并就可以了 内存索引库中。也可以调用addIndexesNoOptimize进行合并 如果是文件索引库,调用addIndexesNoOptimize进行合并,该方法可以接受多个索引库 ...原创 2014-04-14 19:47:49 · 177 阅读 · 0 评论
分享