
数据检索
数据检索
鹤啸九天-西木
天行健,男儿当自强不息;地势坤,君子以厚德载物。
展开
-
Elasticsearch之_search请求体查询
Elasticsearch支持请求体Body放在GET请求中,但因为带请求体的GET请求并不被广泛支持,所以同时支持请求体放在POST请求中。 一、空查询:GET http://$user:$passwd@$host:$port/$index/$type/_search或者GET http://$user:$passwd@$host:$port/$inde...原创 2020-03-04 13:08:37 · 998 阅读 · 1 评论 -
Elasticsearch之_search查询建议
一、概念: 查询建议主要包括两部分: 1、拼写检查纠错建议: 2、搜索词自动补全:二、分类: Elasticsearch提供了4种查询建议: 1、Term(单个单词建议):如果输入的文本是句子,该句子被拆成多个单词,如果在倒排索引中存在该单词在,如果有多个词元在倒排索引中不存在,那么就返回一个数组:G...原创 2020-03-06 23:33:25 · 605 阅读 · 0 评论 -
Elasticsearch之基础概念
一、概述 Elasticsearch(以下简称es)是建立在全文搜索引擎库 Apache Lucene™ 基础上的实时分布式搜索分析引擎。它通过隐藏 Lucene 的复杂性,提供一套简单的 RESTful API。它不仅有Lucene的能力,还是一个分布式的实时文档存储,每个字段可以被索引和搜索、还是一个分布式实时分析搜索引擎、能胜任上百个服务节点的扩展,并支持 PB 级别的结构...原创 2019-09-29 00:13:02 · 252 阅读 · 0 评论 -
Elasticsearch之简单查询
一、查询指定id的文档: 1、使用pretty方式展示文档信息:GET http://$user:$passwd@$host:$port/$index/$type/$id?pretty更多参数请参考:https://www.elastic.co/guide/en/elasticsearch/reference/6.5/common-options.html ...原创 2019-11-05 00:52:04 · 1559 阅读 · 1 评论 -
Elasticsearch之索引维护
Elasticsearch存储数据之前需要先创建索引,类似于结构型数据库建库建表,创建索引时定义了每个字段的索引方式和数据类型。 常用API:1、查看指定索引信息:GET http://$user:$passwd@$host:$port/$index2:创建索引:PUT http://$user:$passwd@$host:$port/$index...原创 2020-02-18 14:49:25 · 679 阅读 · 0 评论 -
Elasticsearch之分析器
1、analyzer:它指定在索引文档或搜索文档时使用的分析器。默认使用标准分析器(standard)分析器。分析器对文档内容的分析包含以下过程: 1>将文本分成适合倒排索引的独立的词条; 2>将这些词条统一为标准格式以提高它们的“可搜索性”,比如: ①大小写转换;...原创 2020-02-24 18:57:32 · 378 阅读 · 0 评论 -
Elasticsearch之_search聚合查询
聚合查询用于分组、汇总等操作,可与查询表达式结合使用。根据不同的汇总用途,主要分为4种不同的聚合。这4种聚合可以并列使用,用不同的自定义聚合结果名称区分。这4种聚合分别是: 一、Metric(指标聚合):主要用于数值汇总计算,可以作为子聚合,但不能包含子聚合。 1、平均值avg:GET http://$user:$passwd...原创 2020-03-04 12:33:17 · 497 阅读 · 0 评论 -
Elasticsearch之映射属性和数值类型
一、属性 Elasticsearch中每个索引定义时都有一个映射mappings,该映射确定如何对文档建立索引。一个映射mappings中主要包含两部分: 1、元字段:主要包括每个文档的_index、_type、_id和_source以及_all等。其中常用的属性有: 1>dynamic:是否可以动态索引数据。可以取值"tr...原创 2020-02-18 13:34:22 · 731 阅读 · 3 评论 -
Elasticsearch之数据维护
数据能被es检索到的前提是这些数据在es中进行了存储,数据入es之前必须要创建相应的索引(_index)、类别(_type),以及确定文档的唯一标识(_id)。文档中每个字段的数据要与创建索引时定义的字段类型相匹配,否则索引数据时会报错。 对数据进行维护时难免会遇到并发的情况,比如两个线程同时对同一个字段进行修改,那么以哪个线程修改的为主呢?这样引出了锁的类型:...原创 2019-11-03 00:42:10 · 856 阅读 · 0 评论 -
Elasticsearch之相关性评分
一、概念: 1、相关性: 确切地说,应该加限定词,应该称作,已匹配到的内容的相关性。通俗地讲,就是已匹配到的内容跟要搜索的词(或句子)像不像。其中,已匹配到的内容,是指那些匹配了部分的搜索词的内容,或者完全和搜索词一模一样,这样就算匹配。而这个“像不像”,有一模一样,9分像,3分像的区别,而这个到底有多像,就是相关性。相关性评分是一个用数字量化的值,值越高,表示相关性越...原创 2020-03-09 23:55:49 · 1193 阅读 · 0 评论 -
Elasticsearch之集群和节点
Elasticsearch集群(cluster)由一个或多个拥有相同cluster.name配置的节点(实例)组成, 它们共同承担数据和负载的压力。当有新节点加入集群中或者从集群中移除节点时,集群将会重新平均分布所有的数据。节点有主节点和非主节点之分,主节点负责管理集群范围内所有的变更。 分片(_shards)是数据的容器,被分配到集群内的各个节点里。分片其实就是Lu...原创 2020-02-18 12:58:58 · 974 阅读 · 0 评论 -
准确率、精确率、召回率
一、约定首先需要明白P、N、T、F分别代表什么,其中: P(Positive):正例,即符合条件的样本; N(Negative):负例,即不符合条件的样本; T(True): 认定结果与实际结果相同,即认定是正确的; F(False): 认定结果与实际结果不同,即认定是错误的;那么P、N和T、F组合会有 2 x 2 =...原创 2020-03-11 21:43:30 · 601 阅读 · 0 评论