python 操作elasticsearch 基本用法

本文详细介绍了如何使用Python与Elasticsearch交互,包括创建索引库、数据插入、查询方式如term、terms、match等,以及聚合查询、排序和计数功能,是Elasticsearch初学者的实用教程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

创建es索引库,相当于创建一个表

     from elasticsearch import Elasticsearch
     from elasticsearch.helpers import bulk
     es = Elasticsearch(hosts='localhost:9200')
     #创建索引表
     es.indices.create(index='my', ignore=400)

插入一条数据到es的索引库中

  data = {"name": "小明", "age": "8", "gender": "男"}
  res = es.index(index='my', doc_type='doc', body=data)

批量插入数据到索引库中

    from elasticsearch.helpers import bulk
    data_lis = [{"name": "小红", "age": "8", "gender": "女"}, {"name": "小王", "age": "8",    "gender": "男"}]
    # 批量插入es创建的索引表
    res2 = bulk(es, data_lis, index='my' )

查询所有的数据

    data = es.search(index='my')
    #查询所有的第二种方法
    body = {
            'query':{
            'match_all':{}
             }
        }
    data = es.search(index='my', body=body)

term: 根据某个字段的值进行查询数据

    # es 官方文档: term 和 terms 是 包含(contains) 操作,而非 等值(equals) (判断)
    body2 =  {
                 "query":{
                   "term":{
                      "age":8 }
                          }
                        }
    data_list = es.search(index='my', body=body2)

terms: 根据某个字段的多个值进行查询数据

    body3 = {
               "query":{
                "terms":{
                 "age:[ 8,10 ] }}}
    age_list = es.search(index='my', body=body3)

match:根据某个字段包含某个字符进行查询

 body4 =  {
           "query":{
               "match":{
                  "name":"红" } 
                  }
           }
    red_list = es.search(index='my', body=body4)

multi_match:根据多个多个字段包含某个字符进行查询

    body = {
            "query":{
                  "multi_match":{
                      "query":"红",
                       "fields":["name","addr"]
                       }
                          }
                  }
     #查询name和addr中包含红的数据
     es.search(index="my", body=body)

match_phrase:匹配tiltle 包含quick fox, 两个字段必须相邻

    body = {
    "query": {
        "match_phrase": {
            "title": {
            	"query": "quick fox",
            	"slop":  1
            }
        }
    }
}
     #查询name和addr中包含红的数据
     es.search(index="my", body=body)

根据id进行查询

    body = {
			"query": {
				"ids": {
					"type": "doc",
					"values": ["vxGrGGwBv1w0KXkAjsEd""wBG_GGwBv1w0KXkAcsEn"
					]
				}
			} }
    h = es.search(index="my",  body=body)

复合条件查询

# bool有3类查询关系,must(都满足), should(其中一个满足), must_not(都不满足)
{
    "query": {
        "bool": {
            "must": [{
                "term": {
                    "name": "小红"
                }
            }, {
                "term": {
                    "age": 18
                }
            }]
        }
    }
}
es.search(index='my', body=body)

range: 范围查询

body = {
    "query": {
        "range": {
            "age": {
                "gte": 18,
                "lte": 30
            }
        }
    }
}

# 查询18<=age<=30的所有数
es.search(index="my_index", doc_type="test_type", body=body)

切片式查询

body = {
    "query": {
        "match_all": {}
    },
    "from": 2,
    "size": 4
}
# 从第2条数据开始,获取4条数据
es.search(index="my", body=body)

通配符查询

body = {
    "query":
        {
        "wildcard":
            {
            "name": "*红"
        }
    }
}
# 查询name字段以红结尾的数据
es.search(index="my",body=body)   

前缀查询

body = {
    "query": {
        "prefix": {
            "name": "李"
        }
    }
}
# 查询前缀为"李"的所有数据
es.search(index='my', body=body)

exists: 查询某个字段是不null数据

# 查询某个字段不是空值:
body = {
  "query": {
    "bool": {
      "must": {
        "exists": {
          "field": "name"
        }
      }
    }
  }
}
es.search(index='my', body=body)

设置查询字段的权重

# ^ 字符语法为单个字段提升权重,在字段名称的末尾添加 ^boost ,其中 boost 是一个浮点数:
body = {
    "query": {
        "multi_match": {
            "query": "明 红",
            "field": ["name^2", 'last_name^1.5', "first_name^0.9"]
        }
    }
}
es.search(index='my', body=body)

排序

body = {
    "query": {
        "match_all": {}
    },
    "sort": {
        "age": {                 # 根据age字段升序排序
            "order": "asc"       # asc升序,desc降序
        }
    }
}

# 多字段排序,注意顺序!写在前面的优先排序
body = {
    "query": {
        "match_all": {}
    },
    "sort": [{
        "age": {                # 先根据age字段升序排序
            "order": "asc"      # asc升序,desc降序
        }
    }, {
        "name": {               # 后根据name字段升序排序
            "order": "asc"      # asc升序,desc降序
        }
    }],
}
es.search(index='my', body=body)

count 执行查询并获取查询匹配的数量

body = {
    "query": {
        "prefix": {
            "name": "李"
        }
    }
}
# 查询前缀为"李"的所有数据
es.count(index='my', body=body)

aggs: 聚合查询获取最大的年龄

body = {
    "query": {
        "match_all": {}
    },
    "aggs": {
        "max_age": {
            "max": {
                "field": "age"
            }
            
        }
    }
}
es.search(index='my', body=body)

aggs: 聚合查询获取最小的年龄

body = {
    "query": {
        "match_all": {}
    },
    "aggs": {
        "min_age": {
            "min": {
                "field": "age"
            }

        }
    }
}
es.search(index='my', body=body)

aggs: 聚合查询获取和的年龄

body = {
    "query": {
        "match_all": {}
    },
    "aggs": {
        "sum_age": {
            "sum": {
                "field": "age"
            }

        }
    }
}
es.search(index='my', body=body)

aggs: 聚合查询获取平均的年龄

body = {
    "query": {
        "match_all": {}
    },
    "aggs": {
        "avg_age": {
            "avg": {
                "field": "age"
            }

        }
    }
}
es.search(index='my', body=body)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值