es实现拼音查询

一、安装elasticsearch-analysis-pinyin分词器


1.下载解压打包
2.解压到elasticsearch plugins 插件目录下
3.重启es查看分词器是否生效


二、kibana配置analysis-pinyin插件


1.测试analysis-pinyin是否生效
1.新建索引
1.1查看 [README.md](https://github.com/medcl/elasticsearch-analysis-pinyin#readme)
1.2.创建一个索引与自定义拼音分析器


2.映射字段,测试保存
3.测试搜索
1.全拼搜索
2.中文搜索
3.中音混合搜索
4.搜索关键字高亮问题
总结


前言


在公司业务需要实现中音,拼音搜索。记录一下实现过程与遇见的问题

一、安装elasticsearch-analysis-pinyin分词器


1.下载解压打包


        1.github下载地址:  elasticsearch-analysis-pinyin.

        2.下载对应的elasticsearch版本,笔者的elasticsearch是7.6.2所有下载拼音分词器必须对应版本

        3.解压

        3.打包(进入解压文件的根目录打包,打包命令:mvn clean package -Dmaven.skip.test=true)

2.解压到elasticsearch plugins 插件目录下


打包好后进入releases目录下把zip拷贝到elasticsearch plugins 插件目录

注意下载的分词器是7.6.2版本打包后的zip是7.4.0版本需要修改版本号否则启动es会报错

解压 unzip elasticsearch-analysis-pinyin-7.4.0.zip -d pinyin

进入plugin-descriptor.properties修改es对应的版本号

保存退出

3.重启es查看分词器是否生效


可以看到已加载analysis-pinyin

二、kibana配置analysis-pinyin插件


1.测试analysis-pinyin是否生效


1.新建索引
1.1查看  


1.2.创建一个索引与自定义拼音分析器


根据README.md创建

PUT test
{
  "settings": {
    "analysis": {
      "analyzer": {
        "pinyin_analyzer": {
          "tokenizer": "my_pinyin"
        }
      },
      "tokenizer": {
        "my_pinyin": {
          "type": "pinyin",
          "keep_separate_first_letter": false,
          "keep_full_pinyin": true,
          "limit_first_letter_length": 16,
          "lowercase": true,
          "remove_duplicated_term": true
        }
      }
    }
  }
}


2.映射字段,测试保存

PUT /test/_mapping
{
  "properties": {
    "title": {
        "type": "text",
        "analyzer": "pinyin_analyzer"
      },
      "price": {
        "type": "float"
      }
  }
}


POST _bulk
{"index":{"_index":"test","_type":"_doc"}}
{"title":"小天你好","price":2699}
{"index":{"_index":"test","_type":"_doc"}}
{"title":"天气真好","price":2699}


3.测试搜索


1.全拼搜索


2.中文搜索


3.中音混合搜索


4.搜索关键字高亮问题
不知道大家有没有发现上面的搜索结果高亮词都是 < em> < /em>xxxx,高亮关键字明显有问题.
github已经有人Issues我们来看一看解决方案  

6.0 后版本的高亮问题 · Issue #169 · infinilabs/analysis-pinyin (github.com)

1.修改上面自定义拼音的tokenizer

PUT test
{
  "settings": {
    "analysis": {
      "analyzer": {
        "pinyin_analyzer": {
          "tokenizer": "my_pinyin"
        }
      },
      "tokenizer": {
        "my_pinyin": {
          "type": "pinyin",
          "keep_full_pinyin": true,
          "keep_original": false,
          "limit_first_letter_length": 16,
          "lowercase": true,
          "remove_duplicated_term": true,
          "ignore_pinyin_offset": false,
          "keep_first_letter": true,
          "keep_separate_first_letter": true
        }
      }
    }
  }
}


2.测试搜索

问题彻底解决

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

这孩子叫逆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值