
lucene
文章平均质量分 80
howareyoutodaysoft
不了了之之了之
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
lucene学习资料
Boosting特性lucene对Document和Field提供了一个可以设置的Boosting参数(权重), 这个参数的用处是告诉lucene, 某些记录更重要,在搜索的时候优先考虑他们 比如在搜索的时候你可能觉得几个门户的网页要比垃圾小站更优先考虑lucene默认的boosting参数是1.0, 如果你觉得这个field重要,你可以把boosting设置为1.5, 1.2原创 2012-10-17 13:24:04 · 968 阅读 · 0 评论 -
Lucene的高亮器Highlighter
Lucene的高亮器HighlighterLucene的高亮器就是给搜索关键词加上HTML标签,这样在网页上显示的时候,可以有不同的突出显示效果。 高亮器会做两个工作: 1)让搜索关键词突出显示。 2)截取出现搜索关键词最多的一段文本生成摘要。 使用高亮器需要引入两个jar文件:lucene-highlighter-3.6.0.jar和lucene-原创 2012-11-25 23:04:09 · 1726 阅读 · 0 评论 -
Lucene以及索引和搜索的流程
Lucene以及索引和搜索的流程Lucene的普及和成功的背后是因为它的简单。 因此,你不需要深入理解Lucene的信息索引和检索工作方面的知识就可以开始使用。 Lucene提供了简单但是强大的核心API去实现全文索引和检索,你只需要掌握少数的类就能将Lucene整合到应用中。 刚接触Lucene的人可能会误认为Lucene是一个文件搜索工具、网络爬虫、或原创 2012-11-25 23:13:54 · 839 阅读 · 0 评论 -
Lucene的排序搜索
Lucene的排序搜索默认根据文档查询的相关度得分来进行排序,得分越高,排名越前。 1、设置Lucene的文档对象Document中的一个促进因子,可以提高相关度得分。Book book = new Book();book.setId(2);book.setTitle("建筑的永恒之道");book.setAuthor("亚历山大");book.setCo原创 2012-11-25 23:06:36 · 1059 阅读 · 0 评论 -
Lucene索引库的简单优化
Lucene索引库的简单优化根据实际情况对索引库进行优化,可以提升创建索引和搜索的速度。 1、合并索引库片段文件 IndexWriter的optimize()方法已经过时,因为这个方法的效率很低。合并文件主要是使用IndexWriter的setMergeFactor(int)方法,但是在Lucene3.6版本中,该方法已过时,直接使用LogMergePolicy原创 2012-11-25 23:19:39 · 1119 阅读 · 0 评论 -
Lucene的中文分词器IKAnalyzer
Lucene的中文分词器IKAnalyzer分词器对英文的支持是非常好的。 一般分词经过的流程: 1)切分关键词 2)去除停用词 3)把英文单词转为小写 但是老外写的分词器对中文分词一般都是单字分词,分词的效果不好。 国人林良益写的IK Analyzer应该是最好的Lucene中文分词器之一,而且随着Lucene的版本原创 2012-11-25 23:41:50 · 2614 阅读 · 0 评论 -
lucene学习资料(索引文件格式详解)
lucene学习资料(索引文件格式详解)本文介绍lucene中segment,.fnm,.fdx,.fdt,.tii,.tis,deletable ,.cfs等格式文件的用途。1。索引的segment每个segment代表lucene的一个完整索引段。通常,在一个索引中,会包含有多个segment。每个segment都有一个统一的前缀,这个前缀是根据当前索引的docum原创 2012-10-17 13:28:36 · 843 阅读 · 0 评论 -
Lucene学习资料(索引机制)
Lucene学习资料(索引机制)简介: Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨原创 2012-10-17 13:27:25 · 960 阅读 · 0 评论 -
Apache Solr(介绍、安装部署、Java接口、中文分词)
Apache Solr 介绍Solr 是什么? Solr 是一个开源的企业级搜索服务器,底层使用易于扩展和修改的Java 来实现。服务器通信使用标准的HTTP 和XML,所以如果使用Solr 了解Java 技术会有用却不是必须的要求。 Solr 主要特性有:强大的全文检索功能,高亮显示检索结果,动态集群,数据库接口和电子文档(Word ,PDF 等)的处理。而且原创 2012-12-11 20:51:43 · 1634 阅读 · 0 评论