
Search Engine
文章平均质量分 85
dxsksk
这个作者很懒,什么都没留下…
展开
-
Lucene---全文检索(数据库)
一,对Lucene的知识进行介绍http://lym6520.iteye.com/category/82172二,以下对最近所使用的Lucene,进行总结下:为了使Lucene创建的索引文件,能够及时与数据库中同步,使用了quartz进行任务调度可查看http://wuquanyin1011.iteye.com/admin/blogs/745382 下面是一个任务调度执行Luc...原创 2010-08-31 10:01:48 · 161 阅读 · 0 评论 -
Lucene---全文检索(处理一对多去重问题 )
在处理如"问答"功能时,以答进行搜索,这时假就会出现去重问题--->http://www.iteye.com/problems/56869 解决方案:1,写个线程管理器,用来存储当前查出的重复数据 /* * CopyRright (c) www.fdauto.com */package com.fdauto.bws.business.module.lucen...原创 2011-01-13 16:15:15 · 694 阅读 · 0 评论 -
Lucene---全文检索(文档pdf/txt/office/html)
一,最近做了一些使用lucene对文档的一些搜索主要使用1,PDFBOX---处理.pdf文件2,poi--------处理office文件 经最近公司重新开发lucene应用,发现以下代码多处bug,,,,可查看...http://wuquanyin1011.iteye.com/admin/blogs/832694进行相应修改 上传文件的jar包如下: ...2010-11-01 11:08:14 · 204 阅读 · 0 评论 -
Lucene---全文检索(问题分析)
创建索引时处理: 一,是否要被分词1,Field.Index.ANALYZED:所传字段会被分词,会根据分词后进行查找2,Field.Index.NOT_ANALYZED:所传字段不会被分词,会根据(原值)进行查找3,Field.Index.NO:不参与分词,也不参与查找 二,是否被持久化保存在文件中1,Field.Store.YES:索引时会被持久化,查找时...2010-12-03 15:46:12 · 484 阅读 · 0 评论 -
Solr研究
一,概述17173搜索是一套对站内各个系统的信息组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户的系统,因为遇到性能问题,故对基于Lucene的搜索框架Solr进行研究,看能否找到相应的解决方案。 二,测试说明1, BBS总共有七千万条数据(40G左右)。2, 在对BBS论坛进行搜索查询时,查询时间久,每次搜索都占用较大的CPU与内存,性能比较低。...2012-03-26 10:14:06 · 169 阅读 · 0 评论