
solr
clamaa
这个作者很懒,什么都没留下…
展开
-
Solr入门
由于现公司要强化一下搜索相关的功能,特对Solr及Lucene进行简要的研究,并做一些个人总结。 Solr采用Lucene搜索库为核心,提供全文索引和搜索的开源企业平台,提供REST的HTTP/XML和JSON的API。 Solr项目的英文主页:http://lucene.apache.org/solr/,其中介绍了Solr的基本情况:Solr is highly reliabl原创 2017-04-11 09:59:40 · 652 阅读 · 0 评论 -
Solr-DIH建立索引并执行简单初步的查询
我们将solr的安装目录设置为$SOLR_INSTALL, ./solr start,不使用任何原有的examples来进行,启动完成后,不存在任何的core,提示No cores available。 在手动执行Add Core操作时,需要保证instanceDir和dataDir事先必须存在,以便能够建立目录成功。 根据错误提示,目录应该建立在$SOLR_原创 2017-04-11 10:00:21 · 1187 阅读 · 0 评论 -
Solr Suggest组件的使用
使用suggest的原因,最主要就是相比于search速度快,In general, we need the autosuggest feature to satisfy two main requirements: ■ It must be fast; there are few things that are more annoying than a clunky type- ahea原创 2017-04-11 10:00:27 · 700 阅读 · 0 评论 -
本地通过源码方式启动solr
首先,下载solr5.5.0源码,http://apache.fayea.com/lucene/solr/5.5.0/solr-5.5.0-src.tgz 解压完成后,分为几个目录,然而solr是通过ant编译的,我们想将其转换为maven方式,发现其中存在dev-tools/maven中,其中对应的说明: Copy the Maven POM templates from原创 2017-04-11 10:00:57 · 2154 阅读 · 0 评论 -
Solr Web增加Basic安全性验证
Solr在5.0版本后,不再提供war包部署的方式,取而代之的是内置了jetty服务, 但是我们发现其中并没有内置任何安全性相关检查,任何人如果知道了我们的外网地址就能直接访问并修改其中的索引。经过查找可以使用jetty的方式来限制web访问。 solr/server/solr-webapp/WEB-INF/web.xml中增加以下字段:原创 2017-04-11 10:02:19 · 1942 阅读 · 0 评论 -
理解和学习Solr的score机制
参考:http://www.cnblogs.com/rcfeng/p/4067896.htmlhttp://www.cnblogs.com/forfuture1978/archive/2010/03/07/1680007.html 在solr的document文档定义中(schema.xml),需要对每个字段进行定义indexed, stored,其中表示的含义为:原创 2017-04-11 10:02:31 · 5221 阅读 · 0 评论 -
一次压测情况下Solr部分性能调整
在将solr模糊词搜索从 copyfield方式修改为 qf(query function)之后,其query的性能降低不少。原来是采用将所有需要搜索的字段都copy至同一个字段中,最近要根据模糊匹配结果的权重分析,这种方式根本无法满足要求,所以就采用了query function,这样就能定义不同字段的权重了,例如我们qf可以如下定义: product_name^2.0 cat原创 2017-04-11 10:03:20 · 2389 阅读 · 0 评论 -
Solr在Linux中的产品化安装
目前服务器上安装的solr版本:5.3.1,不同于测试和研究,如果要把solr产品化部署,需要将其安装成一个服务。在solr压缩包中的bin/目录下有一个脚本文件**install_solr_service.sh**,负责solr的安装,并注册为自启动的service。 1. 环境准备首先需要创建一个solr用户,并赋予其相应的权限:groupadd zpsolruserad原创 2017-04-11 10:04:13 · 650 阅读 · 0 评论