
solr
hxpjava1
毕业于武汉理工大学计算机系,12年开发架构经验,擅长java,k8s
展开
-
搜索引擎选择: Elasticsearch与Solr
搜索引擎选型调研文档Elasticsearch简介*Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎,可以说Lucene是当今最先进,最高效的转载 2017-09-29 12:52:03 · 939 阅读 · 0 评论 -
Solr中的字段类型field type
Solr含有多种字段类型,可用的字段类型基本都定义在了包org.apache.solr.schema中,列举如下:类说明BinaryField二进制数据BoolField布尔值,其中’t’/’T’/’1’都是trueCollationFiled支持Unicode排序Curre转载 2017-09-30 13:23:06 · 1186 阅读 · 0 评论 -
solr学习Field、CopyField、DynamicField
上面一节乱七八槽的讲了一下FieldType。 其实你可以想的简单一点,FieldType就好像是我们在Java中自定义类型。Field: Field就是一个字段,定义一个Field很简单:[html] view plain copyfield name="price" type="sfloat" index转载 2017-09-30 13:30:12 · 397 阅读 · 0 评论 -
solr学习添加文档(Add Document)
一、开篇语 其实Solr就是一个你可以通过他来查询文档的东西,他整个都是基于Document的,那么这些Document从何而来列? 当然是我们给他,而这些来源就包括了:数据库文件,XML,Json,CSV等。。。 然后solr给你转为他自己的格式统一存储, 当你通过他来search的,他就去自己的存储文件里面,将结果集找出来返回给你。虽然以上说法可能不太严谨,但是大致上转载 2017-09-30 13:41:11 · 2046 阅读 · 0 评论 -
solr设置默认搜索字段<defaultSearchField>
solr在没设置默认字段的情况下,搜索格式为“q=name:php学习”的形式,将name设置为默认搜索字段后就可以用“q=php学习”的形式进行搜索了。solr设置默认搜索字段的方法为(我要设置的默认字段为“name”):1. 在schema.xml配置文件中找到text,一般默认情况下,这行配置是被注释的,取消注释,将text改成name。转载 2017-09-30 14:33:25 · 2520 阅读 · 0 评论 -
Solr 配置文件之core.properties、solr.xml和Config Sets
从5.0开始,solr采用了自动发现模式(discovery,区别于传统模式legacy),Solr会自动找到安装目录中、或solr_home中的配置文件:core.properties,并根据里面的name属性来初始化相对于的core。solr.xml中仍然会定义一些配置参数,但是core本身不会定义在这个文件中。Solr会递归搜索所有solr和solr_home目录和子目录转载 2017-09-30 14:43:27 · 1183 阅读 · 0 评论 -
solr中solrconfig.xml详解
前段时间在网上搜索些solrconfig的配置文件资料,发现大都比较零散。因此花了段时间整理相关内容。推荐部分相关资料:http://www.luoshengsha.com/197.htmlhttp://guohf.iteye.com/blog/1440838 这个也对solrconfig总结的比较详细。 solrconfig.xml配置文件主要定义了SOLR的一转载 2017-09-30 14:58:29 · 576 阅读 · 0 评论 -
Solr4.7从数据库导数据
实际工程应用中,从数据库导出数据创建索引再常见不过了,现在实验一下从数据库导入数据创建索引。 一、版本说明Solr版本:4.7.0数据库:sqlserver2005 二、配置步骤1、 准备的jar包1) solr-dataimporthandler-extras-4.7.0.jar;在solr发布包solr-4.7.0\dist里面有2) solr-dat转载 2017-09-30 17:46:04 · 307 阅读 · 0 评论 -
将Solr的数据存到Hdfs上
将Solr的数据存到Hdfs上具体官方文档https://cwiki.apache.org/confluence/display/solr/Running+Solr+on+HDFS修改solrconfig.xml文件class="solr.HdfsDirectoryFactory"> hdfs://192.168.4.20:9000/solr tru转载 2017-09-30 17:47:06 · 1612 阅读 · 0 评论 -
通过spring boot构建solr查询实例
通过spring boot构建solr查询实例spring boot曾经使用spring我们需要各种各样的配置web.xml,配置springapplication.xml。真的很繁琐,要建一个项目框架出来,确实不太容易。而现在spring社区推出spring boot。完全不需要去管那些xml的配置了,springboot采用约定优于配置的思想,通过你项目所需的d转载 2017-10-03 11:15:52 · 2458 阅读 · 0 评论 -
Solr自动生成ID配置
Solr基于Lucene的索引,而索引中的最基本的单元式Document,在Solr中,管理每一个Document(更新、删除、查询),基本都会用到对应的ID,类似关系数据表中的主键。但是,如果我希望Solr能够自动生成这个唯一的ID,有时候也省去了不少的工作,而只需要在Solr中进行配置即可。下面,通过实例来说明,如何配置Solr支持的UUID。在Solr中配转载 2017-09-30 18:04:25 · 721 阅读 · 0 评论 -
Solr 5,5从Mysql全量、增量导入数据
1) 将mysql-connector-java-5.1.26.jar放进solr-5.5.0/dist2)solr-5.5.0/server/solr/core1/conf/solrconfig.xml 配置:[html] view plain copyrequestHandler name="/dataimport" class="o转载 2017-09-30 18:07:10 · 385 阅读 · 0 评论 -
SOLR对多个(关联)表创建索引
又两天没写博客,关于SOLR的东西,写了一周了还没写完我也是醉了,毕竟会的东西真不多,周四晚上加班没写,周五晚上公司同事聚会也没写,今天在家,还是把最后的一点写完吧,我会的剩下的也就是一个对多个表创建索引了,表可以是关联的,也可以是不关联的,下面开始。一、无关联多表创建索引1.1数据库准备 首先在数据库创建一张表,本来有一个tuser表了,我又创建了一个role表,就两三转载 2017-09-30 18:13:58 · 444 阅读 · 0 评论 -
solr的相关操作(addDocument,flush,commit,rollback,optimize,close)解析
在solr中通常包含以下一些操作,包括显式的和隐式的操作1、addDocument,对文档进行分析,分词处理,创建索引段segment,每当flush缓冲区中增加的文档,索引文件都会新建一个段segment。2、commit,除了向Directory对象提交索引变化,搜索器query的重新建立commit提交后,索引flush到硬盘上,并触发listener,创造新的ins转载 2017-09-30 18:55:19 · 475 阅读 · 0 评论 -
Solr 空间搜索配置
Solr 空间搜索配置 1. 在solr目录下的找到conf文件夹下的schema.xml. 在fields元素中添加如下代码 --> 2. 在solr目录下的找到co转载 2017-10-01 13:52:00 · 567 阅读 · 0 评论 -
Solr Facet
一、Facet介绍solr facet 是solr搜索的一大特色,facet不好翻译,有说是垂直搜索,有说是分片搜索,但都不是很好,还是懒得翻译了,就叫facet ,具体功能看下面的例子意会吧。 比如你上淘宝,输入“笔记本”进行搜索,就会出现品牌分类,价格范围等分类,这个就叫facet了。这个例子也许好不是那么准确的描述facet,不过基本上就是这个意思。对输入关键字后搜索转载 2017-09-30 13:09:48 · 271 阅读 · 0 评论 -
Solr -- 查询语法/参数
1. 常用查询参数参数描述defType指定用于处理查询语句(参数q的内容)的查询解析器,eg:defType=lucenesort指定响应的排序方式:升序asc或降序desc.同时需要指定按哪个字段进行排序。eg: sort=price desc,score ascstart指定显示查询结转载 2017-09-30 12:51:52 · 345 阅读 · 0 评论 -
solr6.1 安装,开发demo
一、 环境 solr 6.1.0 下载地址 http://archive.apache.org/dist/lucene/solr/6.1.0/ jdk 1.8 tomcat8二、 安装solr到tomcat 1 解压solr ,把 solr-6.1.0\solr-6.1.0\server 下的solr-webapp 文件夹拷贝到tom转载 2017-09-29 13:50:38 · 256 阅读 · 0 评论 -
windows下安装solr6.4.1
来自百度百科:Solr简介Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于 HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了 Lucene,所以Solr的基本上沿用了Lucene的相关术语。更重转载 2017-09-29 14:54:47 · 326 阅读 · 0 评论 -
solr的collection,shard,replica,core概念
一.collection1.由多个cores组成一个逻辑索引叫做一个collection。一个collection本质上是一个可以跨越多个核的索引,同时包含冗余索引。2.collection由不同的shard组成,每个shard又多个replica,每个shard中有一个leadereplica,每个replica是一个物理索引,所以一个replica对应一个core转载 2017-09-29 15:25:21 · 3973 阅读 · 0 评论 -
Solr Date类型的哪些你不得不了解的细节
我们先来看看Solr日期类型的一些内幕,然后讨论一下Solr日期类型存在的一些问题,最后我们看看怎么解决现存的问题。概述DatePointField在Solr4.x之前,我们只有DatePointField,这类型现在用的应该比较少了,它对应Java中的java.util.Date类型。实现上,如你所知它就是一个long的时间戳。所以它相当于我们用LongField。转载 2017-10-01 15:46:04 · 699 阅读 · 0 评论 -
Solr 多字段、打分规则、权重和实时索引同步
Solr 多字段、打分规则、权重和实时索引同步1、字段 Filed: name:字段名 type:字段类型,影响分词结果 indexed:是否需要索引 stored:是否需要存储 required:是否唯一 multiValued:是否多值,对于copyField字段有效 dynamicField:动态转载 2017-10-01 14:02:59 · 769 阅读 · 0 评论 -
Solr配置停止词/排除词 stopwords(mmseg版)
停止词是无功能意义的词,比如is 、a 、are 、”的”,“得”,“我” 等,这些词会在句子中多次出现却无意义,所以在分词的时候需要把这些词过滤掉。测试于:Solr 4.5.1, mmseg4j 1.9.1, Jdk 1.6.0_45, Tomcat 6.0.37 | CentOS 5.7我这里拿名为test的core做例子。准备停止词在solr home下建di转载 2017-09-29 19:15:13 · 1890 阅读 · 0 评论 -
solr中同义词配置 (Synonyms)
1) 配置 ==========================schema.xml START=================================================^M ^M ^M转载 2017-09-29 19:40:32 · 1301 阅读 · 0 评论 -
Solr Filter过滤器介绍
摘要: Solr的过滤器对接收到的标记流(TokenStream )做额外的处理。参见原文Solr的Analyzer分析器、Tokenizer分词器、Filter过滤器的区别/联系Analyzer负责把文本字段转成token stream,然后自己处理、或调用Tokenzier和Filter进一步处理,Tokenizer和Filter是同等级和顺序执行的关系,一个处理完后交给下一个转载 2017-09-29 19:47:17 · 1558 阅读 · 3 评论 -
Solr Tokenizers分词器介绍
摘要: Solr的分词器(Tokenizers)用来将文本流分解成一系列的标记(tokens)。分析器analyzer 受字段配置的影响,分词器(Tokenizers)于此无关。分析器主要是把字符流(character stream )处理成一系列的标记对象(Token objects)。参见原文。分词器说明输入流中很些信息可能是不需要的,比如空格和标点;有些信息是需要添加的,如同转载 2017-09-29 19:51:47 · 527 阅读 · 0 评论 -
Solr6.5配置中文分词器
Solr作为搜索应用服务器,我们在使用过程中,不可避免的要使用中文搜索。以下介绍solr自带的中文分词器和第三方分词器IKAnalyzer。 注:下面操作在Linux下执行,所添加的配置在windon下依然有效。运行环境 Solr:6.5.1 系统 : Linux 以下是设置 solr中文分词器的方法。注:开始之前,假定你转载 2017-09-29 20:58:20 · 460 阅读 · 0 评论 -
Solr配置文件schema.xml和solrconfig.xml分析
一、字段配置(schema)schema.xml位于solr/conf/目录下,类似于数据表配置文件,定义了加入索引的数据的数据类型,主要包括type、fields和其他的一些缺省设置。1、先来看下type节点,这里面定义FieldType子节点,包括name,class,positionIncrementGap等一些参数。name:就是这个转载 2017-09-29 21:10:16 · 327 阅读 · 0 评论 -
solr进阶七:与jQuery结合的自动补全功能
网上有大量的jQuery自动补全功能的插件,我实现这个功能是采用网友写好的纯jQuery代码,而不是采用插件,因为特效会差很多。而后台的数据是从solr那边获取过来,通过整理,放到对象中,再放到集合中,然后在servlet层解开,生成xml文件,返回到前台,形成自动提示补全的功能,流程非常简单,没有采用框架技术,只是用了JSP的servlet来做中间层而已。目录结构如下:转载 2017-09-29 21:13:42 · 351 阅读 · 0 评论 -
solr进阶二:新建core
在solr的开发包里面的示例文件夹里面,有multicore(多核)这个例子。 把其中的一个core文件夹复制粘贴到我们的solr工作空间目录中就可以了。这个工作空间目录就是我们前面在apache-tomcat-6.0.43\webapps\solr\WEB-INF的web.xml文件里面设置的信息,如下:[html] view plain转载 2017-09-29 21:16:40 · 250 阅读 · 0 评论 -
Solr学习总结Solr查询参数
wiki 地址:http://wiki.apache.org/solr/FrontPage, 里面有各个参数详细的介绍。 一.基本查询 q 查询的关键字,此参数最为重要,例如,q=id:1,默认为q=*:*, fl 指定返回哪些字段,用逗号或空格分隔,注意:字段区分大小写,例如,fl= id,title,sort start 返回结果的第转载 2017-09-30 12:45:34 · 621 阅读 · 0 评论 -
solr约定查询名称
Table 2. Supported keywords inside method namesKeywordSampleSolr Query StringAndfindByNameAndPopularityq=name:?0 AND popularity:?1Orfi转载 2017-10-01 13:53:45 · 318 阅读 · 0 评论