IK中文分词器和elasticsearch操作

本文介绍了如何使用IK中文分词器配合Elasticsearch进行操作,包括安装IK分词器,创建和删除索引,映射类型,导入数据以及执行基本和高级查询。重点强调了在Elasticsearch 5.x版本中设置分片和类型字段的注意事项,以及不能直接修改已有字段类型的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

IK中文分词器和elasticsearch操作

IK中文分词器
  1. 下载安装包

    https://github.com/medcl/elasticsearch-analysis-ik>
    
  2. 将elasticsearch-analysis-ik-5.6.16.zip 复制到虚拟机中

    scp elasticsearch-analysis-ik-5.6.16.zip python@10.211.55.7:~/
    
  3. 安装

    sudo /usr/share/elasticsearch/bin/elasticsearch-plugin install file:///home/python/elasticsearch-analysis-ik-5.6.16.zip
    -> Downloading file:///home/python/elasticsearch-analysis-ik-5.6.16.zip
    [=================================================] 100%
    -> Installed analysis-ik
    
  4. 重新启动

    sudo systemctl restart elasticsearch
    
  5. 测试

    默认分词

    curl -X GET 127.0.0.1:9200/_analyze?pretty -d '
    {
      "analyzer": "standard",
      "text": "我是&中国人"
    }'
    

    IK中文分词器

    curl -X GET 127.0.0.1:9200/_analyze?pretty -d '
    {
      "analyzer": "ik_max_word",
      "text": "我是&中国人"
    }'
    
操作索引
  1. 查看索引
    curl 127.0.0.1:9200/_cat/indices
    
  2. 创建项目文章索引库(创建数据库)
    # 语法
    PUT /my_index
    {
         
        "settings": {
          ... any settings ... },
    }
    # 例子
    curl -X PUT 127.0.0.1:9200/articles -H 'Content-Type: application/json' -d'
    {
       "settings" : {
            "index": {
                "number_of_shards" : 3,
                "number_of_replicas" : 1
            }
       }
    }'
    

    注: 在Elasticsearch 5.x版本中,设置分片与设置索引的类型字段需要分两次设置完成。

  3. 删除项目索引

    用以下的请求来 删除索引:

    DELETE /my_index
    

    你也可以这样删除多个索引:

    DELETE /index_one,index_two
    DELETE /index_*
    

    你甚至可以这样删除 全部 索引:

    DELETE /_all
    DELETE /*
    

    例如

    curl -X DELETE 127.0.0.1:9200/articles
    
创建类型映射(创建表)

类型 在 Elasticsearch 中表示一类相似的文档,类型由 名称映射 ( mapping)组成。

映射, mapping, 就像数据库中的 schema ,描述了文档可能具有的字段或 属性 、 每个字段的数据类型—比如 string, integerdate

为了能够将时间字段视为时间,数字字段视为数字,字符串字段视为全文或精确值字符串, Elasticsearch 需要知道每个字段中数据的类型。

简单字段类型:

  • 字符串: t
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值