
Lucene全文索引
文章平均质量分 61
普通网友
这个作者很懒,什么都没留下…
展开
-
Lucene_demo01_FirstProject
[size=xx-large][color=orange]Lucene_demo01_FirstProject[/color][/size]lucene版本:3.0.1导入下面四个包Junit4测试类:[code="java"]/** * 创建一个索引库,把一个信息加入到索引库中、把信息从索引库中检索出来 */public class HelloLuce...原创 2013-06-07 23:03:34 · 77 阅读 · 0 评论 -
什么是垂直搜索引擎?
什么是垂直搜索引擎? 垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小...原创 2013-06-12 12:17:25 · 1273 阅读 · 1 评论 -
搜索引擎的工作原理
[size=xx-large][b][color=orange]搜索引擎的工作原理[/color][/b][/size][img]http://dl.iteye.com/upload/picture/pic/126093/448cd5d4-ce50-311a-a93f-678778a15c40.jpg[/img][img]http://dl.iteye.com/upload/pictu...原创 2013-06-11 13:32:44 · 217 阅读 · 0 评论 -
Lucene中文分词 “庖丁解牛”
[size=xx-large][color=orange][b]Lucene中文分词 “庖丁解牛”[/b][/color][/size]参考:1.[url]http://code.google.com/p/paoding/[/url]2.Qieqie:王志亮Rose:qieqie.wang@gmail.com[url]http://qieqie.iteye.com/bl...原创 2013-06-11 11:53:49 · 163 阅读 · 0 评论 -
Lucene_demo09_txt文件索引
[b][size=xx-large][color=orange]Lucene_demo09_txt文件索引[/color][/size][/b][code="java"]/** * txt文件索引 */public class IndexFile { private Directory directory; private String indexPat...原创 2013-06-10 15:28:56 · 130 阅读 · 0 评论 -
Lucene_demo08_Hightlighter高亮
[size=xx-large][color=orange][b]Lucene_demo08_Hightlighter高亮[/b][/color][/size][code="java"]/* * 1、使关键字变色 总冠军 * 2、控制摘要的大小 */public class HightlighterTest { @Test public void test...原创 2013-06-10 14:22:37 · 128 阅读 · 0 评论 -
Lucene_demo07_Sort匹配度
[size=xx-large][color=orange][b]Lucene_demo07_Sort匹配度[/b][/color][/size][code="java"]/** * @see 1、相同的结构,相同的关键词,得分一样 * @see 2、相同的结构,不同的关键词,得分不一样,一般情况下,中文高于英文 * @see 3、不同的结构,相同的关键词,关键词的得...原创 2013-06-10 13:19:48 · 280 阅读 · 0 评论 -
Lucene简介
[size=xx-large][color=orange][b]Lucene简介[/b][/color][/size][b]IndexWriter[/b]:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参数使用。 [b]Analyzer[/b]:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有StandardAnalyzer分析器,StopAn...原创 2013-06-09 23:56:24 · 124 阅读 · 0 评论 -
Lucene_demo06_几种搜索
[size=xx-large][color=orange][b]Lucene_demo06_几种搜索[/b][/color][/size][size=medium][color=red][b]创建searcher的过程[/b][/color][/size]1、创建Directory2、根据directory创建indexReader3、根据indexReader创建indexS...原创 2013-06-09 21:04:06 · 98 阅读 · 0 评论 -
Lucene_demo05_内存索引和文件索引
[size=xx-large][color=orange][b]Lucene_demo05_内存索引和文件索引[/b][/color][/size][b]内存索引库:[/b]数据是临时的、访问速度比文件索引库要快、索引库中的数据不能存放太多、内存索引库和文件索引库能结合在一起[b]两个或者两个以上的索引库的合并:[/b] 如果是内存索引库,直接调用构造函数进行合并就可以了 内...原创 2013-06-09 21:03:51 · 115 阅读 · 0 评论 -
Lucene_demo04_分页
[b][size=xx-large][color=orange]Lucene_demo04_分页[/color][/size][/b][code="java"]/** * 分页 */public class DispageTest { // 分页类 private void testSearchIndex(int firstResult, int maxRe...原创 2013-06-08 21:59:43 · 75 阅读 · 0 评论 -
Lucene_demo03_索引库整理
[size=xx-large][color=orange][b]Lucene_demo03_索引库整理[/b][/color][/size]将索引文件夹库中的相同的索引文件_a.cfs、_b.cfs、...重复的合并到一个文件中_b.cfs[code="java"]/** * 索引库整理 * @version 2013-6-8 */public clas...原创 2013-06-08 21:46:35 · 85 阅读 · 0 评论 -
Lucene_demo00_IndexCURD
[color=orange][b][size=xx-large]Lucene_demo00_IndexCURD[/size][/b][/color]索引库创建、查询 、修改 、删除[code="java"]/** * @see 创建索引库,把article对象加入到索引库中 * @see 查询 、修改 、删除 */public class ArticleIn...原创 2013-06-08 00:21:32 · 78 阅读 · 0 评论 -
Lucene_demo02_分词
[size=xx-large][color=orange][b]Lucene_demo02_分词[/b][/color][/size][code="java"]/** * 英文的分词器 中文的分词器 */public class AnalyzerTest { /** * 英文分词:(Lucene自带包) * @throws Exception...原创 2013-06-07 23:43:20 · 74 阅读 · 0 评论 -
基于 Lucene 的8 个开源搜索引擎
基于 Lucene 的8 个开源搜索引擎 摘要: Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...Apache SolrSolr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到 ... Lucene是一种功能强大且被广泛使用的...原创 2013-06-12 12:21:34 · 380 阅读 · 0 评论