
solr
Erica_1230
这个作者很懒,什么都没留下…
展开
-
在Windows的Tomcat环境下部署Solr 4.6.1
在Windows的Tomcat环境下部署Solr 4.7.0转载 2014-11-11 16:05:41 · 624 阅读 · 0 评论 -
IK 中文分词的配置和使用
目前有很多优秀的中文分词组件。本篇只以 IKAnalyzer 分词为例,讲解如何在 solr 中及集成中文分词,使用 IKAnalyzer的原因 IK 比其他中文分词维护的勤快,和 Solr 集成也相对容易。具体就不多介绍,这里直接solr 集成 IK 的方法。 1. 首先,下载IKAnalyzer ,下载 注意:以前老的IK 不支持Solr 5.3的版本 ,转载 2017-06-18 20:34:05 · 981 阅读 · 0 评论 -
SolrCloud和MultiCore的区别
首先我们初步理解一下概念 SolrCloud模式下有 Cluster,Node,Collection,Shard,LeaderCore,ReplicationCore几个概念,这里我引用一下同事对官方概念的翻译:* Cluster群集:群集是一组作为一个单元管理的Solr节点。整个群集必须使用同一套schema和solrconfig* Node节点:一个运行So转载 2016-02-02 14:50:14 · 783 阅读 · 1 评论 -
SOLR使用手册之操作collection
一.Collections API 参考:https://cwiki.apache.org/confluence/display/solr/Collections+API 因为API比较多,我就不一一列举,只列出比较重要的几个1.创建collection官方示例:/admin/collections?action=CREATE&name=name&numShards=n转载 2016-02-03 11:17:20 · 1457 阅读 · 0 评论 -
在linux环境上如何部署SolrCloud
SolrCloud是solr提供的分布式搜索方案,当需要大规模,容错,分布式索引和检索能力的时候使用SolrCloud,它是基于solr和zookeeper的分布式搜索方案。SolrCloud的实现思路是将索引进行分片(shard)拆分,每个分片由多台服务器共同完成,当一个索引和搜索请求过来时分别从不同的shard的服务器中操作索引,它是基于zookeeper来部署的,由于SolrCloud需原创 2016-01-28 01:35:08 · 1476 阅读 · 0 评论 -
solr性能调优
indexed fields 的数量将会影响以下的一些性能: 索引时的时候的内存使用量 索引段的合并时间 优化时间 索引的大小 我们可以通过 将 omitNorms=“true” 来减少indexed fields数量增加所带来的影响。 stored fields R转载 2016-02-02 17:04:20 · 2693 阅读 · 0 评论 -
Solr Dataimporthandler 导入MySQL 内存溢出。
最近准备把一千九百多万数据导入Solr中,在以前测试数据只有一两百万,全量导入没有任务问题。但是,换成一千九百万数据时,solr报内存异常(java.lang.OutOfMemoryError:GC overhead limit exceeded),整个tomcat无法使用。我发现,我给tomcat最大堆内存512M。我觉得,可能是内存过小,于是,我把内存改大些,1024M(set JAVA_OP转载 2016-02-02 16:51:48 · 1470 阅读 · 0 评论 -
Solr主从集群复制
关于solr的集群主要分为主从和SolrCloud两种。主从,比较适合以读为主的场景。SolrCloud适合数据量大,时不时会有更新的情形。那么solr的主从配置很简单。在solrconfig.xml中找到 。这里的replication主要解决主从复制的。它主要实现:在主进行数据写操作,在slave节点进行读操作。当并发量大些,可以通过扩展slave节点数来应对,多个slave做一个反向代理和转载 2016-02-02 14:21:04 · 1991 阅读 · 0 评论 -
SolrCloud中的文件与Collection管理
一.内嵌启动SolrCloud时端口默认分配当 Solr 运行内嵌 zookeeper 服务时,默认使用 solr 端口+1000 作为客户端口,另外,solr 端口+1 作为 zookeeper 服务端口,solr 端口+2 作为主服务选举端口。所以第一个例子中,Solr 运行在 8983端口,内嵌 zookeeper 使用 9983 作为客户端端口,9984 和 9985 作为服务转载 2016-02-02 00:12:27 · 471 阅读 · 0 评论 -
solr 为单独的core导入jar
为solr导入jar的一些总结 在网上大多的资料导入的方式都是将jar直接复制到solr的lib目录,当然学习测试的时候,这是没有问题的,但是当我们将solr真正部署于生成环境时,通常都是虚拟目录的安装,直接引用solr.war。这样部署的好处就是能让应用的部署跟tomcat进行分离,保证以后一个升级维护,和应用的拓展。 所以官方也是如下这么推荐导的例如:转载 2016-02-02 00:06:51 · 954 阅读 · 0 评论 -
solr查询如何支持多个fq
多个fq的url为: Java代码 q=*:*&fq=a:[1 TO *]&fq=b:[2 TO *] 即a大于等于1并且b大于等于2 如果使用 Java代码 ModifiableSolrParams params = new ModifiableSolrParams(); params.set("fq", "a:转载 2015-12-26 09:53:29 · 3916 阅读 · 0 评论 -
solr全量导入
1 配置solrconfig.xml:打开Solr主目录的conf文件夹下(E:\SOLR_HOME\solr\collection1\conf)的配置文件solrconfig.xml,加入一个请求处理者配置: data-config.xml 2 新建data-config.xml:就在这个同级目录conf下新建转载 2016-01-27 14:41:24 · 1396 阅读 · 0 评论 -
solr-4.6配置中文分词器ik-analyzer
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。一、版本信息solr版本:4.6需要ik-analyzer版本:IK Analyzer 2012FF_hf1二、配置步骤下载压缩解压我们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\W转载 2016-01-27 12:05:34 · 1372 阅读 · 0 评论 -
solr安装-tomcat+solrCloud构建稳健solr集群
solrCloud的搭建可以有两种方式:使用solr内嵌的jetty来搭建;使用外部web容器tomcat来搭建。对于使用jett来搭建参考solr官方的手册照着做肯定ok,下面我主要讲的是如何使用tomcat来搭建solrCloud。废话不多说,开始我们的工作!1.搭建tomcat单机版solr见我的上一篇博文solr安装-tomcat单机版2.安装配转载 2016-01-24 02:08:31 · 838 阅读 · 0 评论 -
solrCloud+tomcat+zookeeper集群配置
概述: SolrCloud是基于Solr和Zookeeper的分布式搜索方案,它的主要思想是使用Zookeeper作为集群的配置信息中心。它有几个特色功能:1)集中式的配置信息2)自动容错3)近实时搜索4)查询时自动负载均衡 安装zookeeper 上面也说了 SolrCloud是基于Solr和Zookeeper的分转载 2016-01-24 02:01:51 · 564 阅读 · 0 评论 -
SolrCloud原理介绍
一.简介SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式。 二.特色功能SolrCloud有几个特色功能:集中式的配置信息使用ZK进行集中配置。启动时可以指定把Solr的相关转载 2016-01-24 01:56:17 · 1033 阅读 · 0 评论 -
Solr 5.x集成中文分词word
使用标准分词器,如图: 使用word分词器 下载word-1.3.jar,注意solr的版本和word分词的版本 将文件word-1.3.jar拷贝至文件夹C:\workspace\Tomcat7.0\webapps\solr\WEB-INF\lib\下 修改如下文件C:\workspace\solr_home\solr\mysolr\conf\schema.xml...转载 2019-05-15 14:16:54 · 243 阅读 · 0 评论