
Lucene/Solr
文章平均质量分 93
阿奇XS
人贪安逸易失志,马遇软地易失蹄。(微信号:benyzhous)
展开
-
solr4.7中文分词器(ik-analyzer)配置
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。一、版本信息solr版本:4.7.0需要ik-analyzer版本:IK Analyzer 2012FF_hf1ik-analyzer下载地址:http://code.google.com/p/i转载 2015-04-01 17:49:58 · 857 阅读 · 0 评论 -
Solr4.7从数据库导数据
实际工程应用中,从数据库导出数据创建索引再常见不过了,现在实验一下从数据库导入数据创建索引。 一、版本说明Solr版本:4.7.0数据库:sqlserver2005 二、配置步骤1、 准备的jar包1) solr-dataimporthandler-extras-4.7.0.jar;在solr发布包solr-4.7.0\dist里转载 2015-04-01 17:49:51 · 632 阅读 · 0 评论 -
solrCloud+tomcat+zookeeper配置
一、环境准备:Solr版本:4.7.0下载地址:http://www.apache.org/dyn/closer.cgi/lucene/solr/4.7.0 Tomcat版本:6.0.39下载地址:http://tomcat.apache.org/download-60.cgi ZooKeeer版本:3.4.6下载地址:http://转载 2015-04-01 17:54:02 · 697 阅读 · 0 评论 -
Solr4.7从文件创建索引
索引数据源并不会一定来自于数据库、XML、JSON、CSV这类结构化数据,很多时候也来自于PDF、word、html、word、MP3等这类非结构化数据,从这类非结构化数据创建索引,solr也给我们提供了很好的支持,利用的是apache tika。下面我们来看看在solr4.7中如何从pdf文件创建索引。 一、配置文件索引库1、 新建core我们新建一个转载 2015-04-01 17:45:28 · 838 阅读 · 0 评论 -
SolrCloud Hello Word
Solr Cloud 设计出来的目的是使你的搜索服务具有更高的可用性,提高容错、容灾能力。下面我们在一台电脑上建立2个solr服务,作为一个solrCloud分片(shard),初步认识一下solrCloud。SolrCloud使用zoo_keeper作为集群管理工具,本例中,我们使用solr发布包内嵌的zoo_keeper。一、准备工作建立一个solr_home目录,我建在D盘根转载 2015-04-01 17:52:13 · 608 阅读 · 0 评论 -
SolrCloud简介
原文地址:http://www.chepoo.com/solrcloud-introduction.html一.简介SolrCloud是Solr4.0版本以后基于Solr和Zookeeper的分布式搜索方案。SolrCloud是Solr的基于Zookeeper一种部署方式。Solr可以以多种方式部署,例如单机方式,多机Master-Slaver方式。转载 2015-04-01 17:52:08 · 573 阅读 · 0 评论 -
ZooKeeper原理及配置
ooKeeper实验版本:3.4.6ZooKeeper下载地址:http://www.apache.org/dyn/closer.cgi/zookeeper/ zookeeper是一个高可用性,高性能的协调服务。 解决哪些问题在分布式应用中,经常会出现部分失败的情况,即当节点间传递消息的时候由于网络或者接收者进程死掉等原因,发送者无法知道接收者是否收转载 2015-04-01 17:52:49 · 1054 阅读 · 0 评论 -
solr4.x设置默认查询字段
1、如果需要同时在title和content中进行查询,可以添加如下字段:其中:title_content为新定义的查询字段,如果需要同时在title和content中进行查询,那么就使用这个查询字段2、设置默认查询字段,这样的话就不需要在Query中进行查询时使用my_title:hello这样的格式将solrconfig.xml中得 text修改为: title_c原创 2015-04-03 01:40:44 · 3100 阅读 · 0 评论 -
Apache Solr查询语法
查询参数常用:q - 查询字符串,必须的。fl - 指定返回那些字段内容,用逗号或空格分隔多个。start - 返回第一条记录在完整找到结果中的偏移位置,0开始,一般分页用。rows - 指定返回结果最多有多少条记录,配合start来实现分页。sort - 排序,格式:sort=<field name>+[,+]。示例:(inStock desc, price asc)表示先转载 2015-05-08 10:57:07 · 1062 阅读 · 0 评论 -
SOLR搭建企业搜索平台
一、 SOLR搭建企业搜索平台 运行环境: 运行容器:Tomcat6.0.20 Solr版本:apache-solr-1.4.0 分词器:mmseg4j-1.6.2 词库:sogou-dic 准备工作: 下载tomcat 6.0.20:http://tomcat.apache.org/download-60.cgi 下载solr:http://apache.et转载 2015-05-08 00:47:12 · 1610 阅读 · 1 评论 -
solr4.7新建core
Solr里面的core就像数据库里面的一个表,用来管理索引和相关配置。 一、使用示例core下载的solr完整包里面solr-4.7.0\example\multicore这个文件夹下面有2个示例core;分别是core0和core1;如下图:随便拷贝个到 $SOLR_HOME$,$SOLR_HOME$在什么地方配置的呢,就是你solr的web服转载 2015-04-01 17:48:36 · 656 阅读 · 0 评论 -
全文检索引擎Solr系列—–全文检索基本原理
场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”所在的位置,此时你会怎么查呢?毫无疑问,你的眼睛会从38页的第一个字开始从头至尾地扫描,直到找到“坑爹”二字为止。这种搜索方法叫做顺序扫描法。对于少量的数据,使用顺序扫描是够用的。但是妈妈叫你查出坑爹的“坑”字在哪一页时,你要是从第一页的第一个字逐个的扫描下去,那你真的是被坑了。此时你就需要用到索引。索引记录了“坑”字在哪一页,你转载 2015-04-01 10:53:14 · 4803 阅读 · 0 评论 -
Solr4.7缓存技术
磁盘IO往往是计算机系统响应速度的一个突出瓶颈,搜索引擎查询很平凡,减少搜索过程中的磁盘IO对提升搜索响应速度无疑有莫大的帮助,在solr中,提供自带的缓存机制。我们只需要在solrconfig.xml中加几个配置项就可以了。下面我们看看solr的3个缓存。Filter cache:这个是被用来缓存过滤器(就是查询参数fq)的结果和基本的枚举类型。Document cach转载 2015-04-01 17:50:50 · 654 阅读 · 0 评论 -
让Solr返回JSON数据
http://localhost:1985/solr/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on&wt=json solr的http请求后加一个wt参数 返回则是text/plain的json字符串。如下图所示:默认的是返回xml数据,将以上请求参数的wt去掉或者wt=xml,即可得xml数据,请转载 2015-04-01 21:56:48 · 3047 阅读 · 0 评论 -
Solr搜索结果说明
在admin页面,输入相关内容后,会返回xml格式的内容。说明如下:[html] view plaincopyxml version="1.0" encoding="UTF-8"?> response> lst name="responseHeader"> int name="status">0int>原创 2015-04-02 17:15:57 · 893 阅读 · 0 评论 -
Solr基础理论与维护管理快速上手(含查询参数说明)
1、 solr基础因为 Solr 包装并扩展了 Lucene,所以它们使用很多相同的术语。更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。在 Solr 和 Lucene 中,使用一个或多个 Document 来构建索引。Docume转载 2015-04-02 17:15:28 · 902 阅读 · 0 评论 -
利用SolrJ操作solr API完成index操作
使用SolrJ操作Solr会比利用httpClient来操作Solr要简单。SolrJ是封装了httpClient方法,来操作solr的API的。SolrJ底层还是通过使用httpClient中的方法来完成Solr的操作。1、 首先,你需要添加如下jar包其中apache-solr-solrj-3.4.0.jar、slf4j-api-1.6.1.jar可以在下载的apache-原创 2015-04-02 17:13:03 · 1161 阅读 · 1 评论 -
Solr部署详解
Solr部署详解时间:2013-11-24方式:转载目录 1 solr概述 1.1 solr的简介 1.2 solr的特点 2 Solr安装 2.1 安装JDK 2.2 安装Tomcat 2.3 安装solr 2.4 目录结构说明 2.5 SOLR HOME说明 3 Solr配置转载 2015-04-02 17:42:36 · 16108 阅读 · 6 评论 -
lucene 索引查看工具
luke 是 lucene 索引查看工具,基于 swing 开发的,是 lucene、solr、nutch 开发过程中不可或缺的工具。在测试搜索过程,进程出现搜不到东西或者搜到的东西不是想要的结果时,这时就需要用 luke 查看一下索引库的情况,来协助排查问题。它能访问Lucene建立好的索引同时也允许以如下的一些方式展示和修改内容:1、按文档(Document)号或者词项浏览2、查看原创 2015-04-02 14:21:30 · 2112 阅读 · 0 评论 -
Solr入门之SolrServer实例化方式
随着solr版本的不断升级, 差异越来越大, 从以前的 solr1.2 到现在的 solr4.3, 无论是类还是功能都有很大的变换, 为了能及时跟上新版本的步伐, 在此将新版本的使用做一个简单的入门说明: Solr3.6版本 SolrServer实例化类型有httpClient,和本地化,如果Solr服务器不在本地就用httpClient,在本地就用Embedded转载 2015-04-02 14:49:28 · 1676 阅读 · 0 评论 -
solr 从零学习开始
2010-10目 录 1 概述... 41.1 企业搜索引擎方案选型... 41.2 Solr的特性... 41.2.1 Solr使用Lucene并且进行了扩展... 41.2.2 Schema(模式)... 51.2.3 查询... 51.2.4 核心.转载 2015-04-02 17:20:04 · 6028 阅读 · 1 评论 -
solr总结 第六部分:solr查询语法
1.基本查询语法q:全文查询。schema.xml里面定义了如下两块。eg q=ibm即表示org_name或者org_weisite里面出现ibm的document都可以被匹配到。KeyWords查询就是这个参数。Java代码 via copyField further on in this schema --> "text转载 2015-05-08 00:07:34 · 1178 阅读 · 0 评论