Elasticsearch 的使用

Install

参考

https://www.elastic.co/guide/en/elasticsearch/reference/8.0/install-elasticsearch.html
https://www.elastic.co/guide/en/elasticsearch/reference/8.0/targz.html


Elasticsearch 版本:6.8.8

文章参考如下链接,但有些内容可能过时,以实践结果为主:

https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html

Index API

创建 index
PUT http://localhost:9200/twitter

PUT http://localhost:9200/twitter/tweet/1

自动索引创建
如果索引不存在,会自动创建,并使用一些默认的索引模板

Get API

GET http://localhost:9200/twitter/tweet/1

Delete API

DELETE http://localhost:9200/twitter/tweet/1

Delete By Query API

POST http://localhost:9200/twitter/_delete_by_query

{
  "query": { 
    "match": {
      "message": "some message"
    }
  }
}

查询在传值的时候必须用 query 作为 key

Search APIs

所有的搜索 API 可以在一个 index 中跨越多个 type 进行使用,也可跨越多个索引。

例如,我们可以在 twitter 索引上跨越所有 type 搜索所有 document:
GET /twitter/_search?q=user:kimchy

我们也可以指定多个类型:
GET /twitter/tweet,user/_search?q=user:kimchy

跨越多个 index 搜索指定 type,指定标签:
GET /kimchy,elasticsearch/tweet/_search?q=tag:wow

搜索所有 index 指定 type,用 _all 代表所有 index
GET /_all/tweet/_search?q=tag:wow

搜索所有 index 所有 type
GET /_search?q=tag:wow

Query String 语法
查询字符串被解析为一系列 term 和 operator。一个 term 可以是一个单词 —— quick 或者 brown;或者是一个短语,被双引号包裹 —— “quick brown”,以相同的顺序搜索短语中的所有单词。

Field names

status 包含 active

status:active

title 包含 quick 或者 brown。如果你省略 OR,使用默认的操作符

title:(quick OR brown)
title:(quick brown)

author 包含 “john smith”

author:"John Smith"

任意字段 book.title, book.content 或者 book.date 类似,包含 quick 或者 brown

book.\*:(quick brown)

字段 title 有非空值

_exists_:title

通配符

通配符搜索可以在单个 term 上运行,使用 ? 代表一个单个字符,使用 * 代表 0 个或多个字符:

qu?ck bro*

但是注意,通配符查询会使用大量内存,并且表现糟糕,

注意:单纯的通配符 * 为了提高效率,会被重写为 exists 查询。因此,通配符 "field:*" 将会匹配下面有空值的 document:

{
	"field": ""
}

并且如果字段不存在或者设置为 null,将不会被匹配:

{
	"field": ""
}

正则表达式

通过包裹斜杠("/")可以将正则表达式嵌入查询字符串中:

name:/joh?n(ath[oa]n)/

模糊查询

使用模糊运算符来搜索相似的 term:

quikc~ brwn~ foks~

使用 Damerau-Levenshtein 距离来查找最多两个更改,其中的更改时单个字符的插入,删除或者替换,或者相邻字符的换位

默认的编辑距离是 2,但编辑距离为 1 应足以捕获所有人类拼写错误的 80%。它可以指定为:

quikc~1

范围查询

范围可以是日期,数字或者字符串。左右闭区间使用方括号 [min TO max] 左右开区间使用花括号 {min TO max}

  • 2012 所有的天
date:[2012-01-01 TO 2012-12-31]
  • 数字 1-5
count:[1 TO 5]
  • 标签在 alpha 和 omega 之间,不包括 alpha 和 omega
tag:{alpha TO omega}
  • 数字 10 以上
count:[10 TO *]
  • 2012 年之前
date:{* TO 2012-01-01}

方括号和花括号也可以组合

  • 数字1 到 5,但不包括 5
count:[1 TO 5}

有一侧无界可以使用以下语法:

age:>10
age:>=10
age:<10
age:<=10

Boolean 运算符

默认,所有 term 都是可选的,只要一个 term 匹配即可。搜索 foo bar baz 将会找到所有包含一个或多个 foo 或 bar 或 baz 的文件。
首选运算符 + (该 term 必须出现)和 - (该 term 禁止出现)。所有其他术语都是可选。例如:

quick brown +fox -news
  • fox 必须出现
  • news 禁止出现
  • quick 和 brown 是可选的

Simple Query String Query

这是一种使用 SimpleQueryParser 解析上下文的查询方式。与常规的 query_string 查询不同的是,simple_query_string 查询不会抛出异常,并且会丢弃查询的无效部分,比如下面这个例子:
GET /_search

{
  "query": {
    "simple_query_string" : {
        "query": "\"fried eggs\" +(eggplant | potato) -frittata",
        "fields": ["title^5", "body"],
        "default_operator": "and"
    }
  }
}

Simple Query String 语法

simple_query_string 支持如下特定字符:

  • + 表示 AND
    |

GET /_search

{
    "query": {
        "simple_query_string" : {
            "fields" : ["content"],
            "query" : "foo bar -baz"
        }
    }
}

如果你希望得到包含 “foo” 或者 “bar”,但是不能包含 “baz”,由于 default_operator 是 OR,那么这其实意味着:匹配包含 “foo” 或者包含 “bar” 或者不包含 “baz”。显然,这不是所希望的,那么查询可以写成 "foo bar +-baz",这样就不会返回包含 “baz” 的 document 了。

默认字段

在查询字符串语法中,未指定搜索的字段时,index.query.default_field 将用于得到哪个字段需要搜索。它默认是 *,并且查询将会自动尝试去确定 index 的 mapping 中可查询的存在字段,然后在这些字段上执行搜索。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

罐装面包

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值