
搜索引擎
文章平均质量分 59
zhangjunhd
不想当产品经理的程序员不是好CEO
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
LuceneInAction-理解索引和搜索过程的核心类
理解索引过程的核心类IndexWriter (写索引)是索引过程的核心组件。这个类负责创建新索引或者打开已有索引,以及向索引中添加、删除或更新被索引文档的信息。Directory 描述了Lucene索引的存放位置。是一个抽象类。FSDirectory是具体子类。Analyzer 文本文件在被索引之前,需要经过Analyzer处理。它负责从被索引文件中提取词汇单元,并剔除剩下的无用信息。原创 2017-01-26 22:01:47 · 224 阅读 · 0 评论 -
LuceneInAction-构建索引
Lucene如何对搜索内容进行建模文档和域文档是Lucene索引和搜索的原子单位。文档为包含一个或多个域的容器,而域则依次包含“真正的”被搜索的内容。每个域都有一个标识名称,该名称为一个文本值或二进制值。Lucene可以针对域进行3种操作: - 域值可以被索引(或者不被索引)。如果需要搜索一个域,则必须首先对它进行索引。被索引的域值必须是文本格式的(二进制格式的域值只能被存储而不能被索引)。在搜索原创 2017-02-03 15:32:19 · 319 阅读 · 0 评论 -
LuceneInAction-实现简单的搜索功能
Lucene主要的搜索API: 类 目的 IndexSearcher 搜索引擎的门户。所有搜索都通过IndexSearcher进行,它们会调用该类中重载的search方法 Query(及其子类) 封装某种查询类型的具体子类。Query实例将被传递给IndexSearcher的search方法 QueryParser 将用户输入的(可读的)查询表达式处理成具体的Query原创 2017-02-03 15:37:46 · 307 阅读 · 0 评论 -
LuceneInAction-近实时搜索
它使你能够使用一个打开的IndexWriter快速搜索索引的变更内容,而不必首先关闭writer或向该writer提交。在过去,由于没有这个功能,必须调用writer中commit方法,然后重新打开reader,但这个处理过程会非常耗时,因为commit方法必须对索引中所有的新文件进行同步。代码NearRealTimeTest.javaimport org.apache.lucene.util.Ve原创 2017-02-03 15:39:46 · 177 阅读 · 0 评论 -
LuceneInAction-explain()理解搜索结果评分
Explainer.javaimport org.apache.lucene.analysis.SimpleAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.queryParser.QueryParser;import org.apache.lucene.search.Explanation原创 2017-02-03 15:41:34 · 162 阅读 · 0 评论 -
LuceneInAction-多样化查询
通过项进行搜索:TermQuery类通过匹配isbn来检索某个文档:import lia.common.TestUtil;import org.apache.lucene.index.Term;import org.apache.lucene.search.IndexSearcher;import org.apache.lucene.search.Query;import org.apach原创 2017-02-03 15:44:45 · 361 阅读 · 0 评论