
搜索技术
文章平均质量分 82
frankaqi
这个作者很懒,什么都没留下…
展开
-
solr定时实时重建索引和增量更新
Solr Data Import Hander Scheduler 说明: Solr官方提供了很强大的Data Import Request Handler,同时提供了一个简单的 Scheduler, 示例中的 Scheduler 只支持增量更新,不支持定期重做索引,因此我做了一个简单的封装,增加了重做索引的定时器. (原定时器作者是:Marko Bonaci, 在此转载 2015-11-06 00:04:04 · 2097 阅读 · 0 评论 -
Lucene / Solr 开发经验
注意:该文章所属Blog中的日记遵循Creative Commons(创作共用)授权 ,您可以任意转载,转载时请务必以超链接形式标明文章原始出处 和作者信息 及本声明 。 [开篇语 ]按照惯例应该写一篇技术文章了,这次结合Lucene/Solr来分享一下开发经验。 Lucene是一个使用Java语言写的全文检索开发包(API),利用它可以实现强大的检索功能,它的详细介绍大家可以去转载 2015-11-05 23:59:55 · 541 阅读 · 0 评论 -
crawler4j:轻量级多线程网络爬虫
crawler4j是Java实现的开源网络爬虫。提供了简单易用的接口,可以在几分钟内创建一个多线程网络爬虫。 安装 使用Maven 使用最新版本的crawler4j,在pom.xml中添加如下片段: XHTML edu.uci.ics crawler4j 4.1 1 2 3 4 5转载 2016-01-01 23:17:16 · 1586 阅读 · 0 评论