
ElasticSearch
丨许晨丨
礼貌和教养不只是干瘪单薄的客套,还有推己及人的周到和体谅。
展开
-
ElasticSearch使用总结(一)
1.什么是ElasticSearchElasticSearch是一个基于Apache Lucene的分布式多用户能力的全文搜索引擎Elasticsearch是用Java开发的,提供简单易用的RESTful web API。轻松的横向扩展,支持PB级的结构化数据或者非结构化数据处理。 2.索引创建 es是以restful风格来命名自己的api的,动作是以http方法来决定的 创建...原创 2018-04-11 11:37:29 · 6398 阅读 · 2 评论 -
ElasticSearch使用总结系列
《ElasticSearch使用总结》系列:Elasticsearch使用已经近一年时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,企业实际开发的角度进行详细梳理。欢迎讨论。 以下文章已经收录到本人专栏:Elasticsearch从入门到开发之路ElasticSearch使用总结(一):索引的创建ElasticSearch使用总结(二):CRUD操...原创 2018-04-21 13:08:15 · 4439 阅读 · 0 评论 -
ElasticSearch使用总结(五)
Elasticsearch是一款提供检索以及相关度排序的开源框架,同时,也支持对存储的文档进行复杂的统计——聚合。 ES中的聚合被分为两大类:Metric度量和bucket桶(原谅我英语差,找不到合适的词语…..就用单词来说吧!)。说的通俗点,metric很像SQL中的avg、max、min等方法,而bucket就有点类似group by了。 本篇就简单的介绍一下metric聚合的用法。 m...原创 2018-04-21 12:31:51 · 2438 阅读 · 0 评论 -
ElasticSearch使用总结(四)
分页查询按照一般的查询流程来说,如果我想查询前10条数据:1 客户端请求发给某个节点 2 节点转发给个个分片,查询每个分片上的前10条 3 结果返回给节点,整合数据,提取前10条 4 返回给请求客户端 那么当我想要查询第10条到第20条的数据该怎么办呢?这个时候就用到分页查询了。from-size”浅”分页” 浅”分页的概念是我自己定义的,可以理解为简单意义上的分页。它的原理...原创 2018-04-20 22:22:33 · 2857 阅读 · 0 评论 -
ElasticSearch使用总结(三)
高级查询有多好,就是有多么匹配。 全文本查询分为模糊查询,习语匹配,以及多个字段的查询。 模糊查询 习语匹配 多个字段查询 语法查询 结构化数据查询 term查询具体项 范围查询 range范围,gte大于等于,lte小于等于 子条件查询 子条件查询要结合bool,filter就是来做数据过滤的,而且es会对他的数据进行缓存。所...原创 2018-04-20 16:07:59 · 2826 阅读 · 0 评论 -
ElasticSearch使用总结(二)
可视化工具postman数据的crud操作 新增数据people是索引,man是类型,1是指定的id 可以修改put为post,不指定id,es自动为我们编写id,插入数据 修改文档数据a)直接修改文档数据 b)通过脚本修改 要修改的文本定义在关键词doc后面 es支持多种脚本语音,自带painless,支持js,python等,这里用自带的painless ...原创 2018-04-19 23:26:35 · 2213 阅读 · 0 评论 -
ElasticSearch使用总结(十)
ElasticSearch 支持Java正则表达式查询,但是,在对大段的文本(Text Block)进行挖掘之前,必须了解正则表达式查询的特殊之处。由于分析器会对文本字段进行分词,移除停用词,小写转换等操作,最终存储在倒转索引中的是小写的标记流(Token Stream),默认情况下,每一个标记是一个分词(Term),这无法满足正则表达式查询的一般要求,这就是说,正则表达式查询的是原始文本,需要注...原创 2018-04-22 17:21:57 · 2408 阅读 · 0 评论 -
ElasticSearch使用总结(九)
在ElasticSearch中文档存储的介质分为内存和硬盘:内存速度快,但是容量有限;硬盘速度较慢,但是容量很大。同时,ElasticSearch进程自身的运行也需要内存空间,必须保证ElasticSearch进程有充足的运行时内存。为了使ElasticSearch引擎达到最佳性能,必须合理分配有限的内存和硬盘资源。 一.倒排索引(Inverted Index) ElasticSearch引擎...原创 2018-04-22 13:44:17 · 2178 阅读 · 0 评论 -
ElasticSearch使用总结(八)
Elasticsearch中,内置了很多分词器(analyzers)。下面来进行比较下系统默认分词器和常用的中文分词器之间的区别。系统默认分词器:1、standard 分词器 英文的处理能力同于StopAnalyzer.支持中文采用的方法为单字切分。他会将词汇单元转换成小写形式,并去除停用词和标点符号。/**StandardAnalyzer分析器*/ public v...原创 2018-04-22 09:49:01 · 3031 阅读 · 0 评论 -
ElasticSearch使用总结(七)
Elasticsearch提供了多种聚合方式,能帮助用户快速的进行信息统计与分类,本篇主要讲解下如何使用Range区间聚合。最简单的例子,想要统计一个班级考试60分以下、60到80分、80到100分,在ES中只要一个命令就可以轻松统计…. 聚合例子{ "aggs":{ "grade_ranges":{ "range":{ ...原创 2018-04-22 06:47:36 · 2337 阅读 · 0 评论 -
ElasticSearch使用总结(六)
之前总结过metric聚合的内容,本篇来说一下bucket聚合的知识。Bucket可以理解为一个桶,他会遍历文档中的内容,凡是符合要求的就放入按照要求创建的桶中。 本篇着重讲解的terms聚合,它是按照某个字段中的值来分类: 比如性别有男、女,就会创建两个桶,分别存放男女的信息。默认会搜集doc_count的信息,即记录有多少男生,有多少女生,然后返回给客户端,这样就完成了一个terms得统计...原创 2018-04-21 14:35:18 · 3461 阅读 · 0 评论