一、安装elasticsearch-analysis-pinyin分词器
1.下载解压打包
2.解压到elasticsearch plugins 插件目录下
3.重启es查看分词器是否生效
二、kibana配置analysis-pinyin插件
1.测试analysis-pinyin是否生效
1.新建索引
1.1查看 [README.md](https://github.com/medcl/elasticsearch-analysis-pinyin#readme)
1.2.创建一个索引与自定义拼音分析器
2.映射字段,测试保存
3.测试搜索
1.全拼搜索
2.中文搜索
3.中音混合搜索
4.搜索关键字高亮问题
总结
前言
在公司业务需要实现中音,拼音搜索。记录一下实现过程与遇见的问题
一、安装elasticsearch-analysis-pinyin分词器
1.下载解压打包
1.github下载地址: elasticsearch-analysis-pinyin.
2.下载对应的elasticsearch版本,笔者的elasticsearch是7.6.2所有下载拼音分词器必须对应版本
3.解压
3.打包(进入解压文件的根目录打包,打包命令:mvn clean package -Dmaven.skip.test=true)
2.解压到elasticsearch plugins 插件目录下
打包好后进入releases目录下把zip拷贝到elasticsearch plugins 插件目录
注意下载的分词器是7.6.2版本打包后的zip是7.4.0版本需要修改版本号否则启动es会报错
解压 unzip elasticsearch-analysis-pinyin-7.4.0.zip -d pinyin
进入plugin-descriptor.properties修改es对应的版本号
保存退出
3.重启es查看分词器是否生效
可以看到已加载analysis-pinyin
二、kibana配置analysis-pinyin插件
1.测试analysis-pinyin是否生效
1.新建索引
1.1查看
1.2.创建一个索引与自定义拼音分析器
根据README.md创建
PUT test
{
"settings": {
"analysis": {
"analyzer": {
"pinyin_analyzer": {
"tokenizer": "my_pinyin"
}
},
"tokenizer": {
"my_pinyin": {
"type": "pinyin",
"keep_separate_first_letter": false,
"keep_full_pinyin": true,
"limit_first_letter_length": 16,
"lowercase": true,
"remove_duplicated_term": true
}
}
}
}
}
2.映射字段,测试保存
PUT /test/_mapping
{
"properties": {
"title": {
"type": "text",
"analyzer": "pinyin_analyzer"
},
"price": {
"type": "float"
}
}
}
POST _bulk
{"index":{"_index":"test","_type":"_doc"}}
{"title":"小天你好","price":2699}
{"index":{"_index":"test","_type":"_doc"}}
{"title":"天气真好","price":2699}
3.测试搜索
1.全拼搜索
2.中文搜索
3.中音混合搜索
4.搜索关键字高亮问题
不知道大家有没有发现上面的搜索结果高亮词都是 < em> < /em>xxxx,高亮关键字明显有问题.
github已经有人Issues我们来看一看解决方案
6.0 后版本的高亮问题 · Issue #169 · infinilabs/analysis-pinyin (github.com)
1.修改上面自定义拼音的tokenizer
PUT test
{
"settings": {
"analysis": {
"analyzer": {
"pinyin_analyzer": {
"tokenizer": "my_pinyin"
}
},
"tokenizer": {
"my_pinyin": {
"type": "pinyin",
"keep_full_pinyin": true,
"keep_original": false,
"limit_first_letter_length": 16,
"lowercase": true,
"remove_duplicated_term": true,
"ignore_pinyin_offset": false,
"keep_first_letter": true,
"keep_separate_first_letter": true
}
}
}
}
}
2.测试搜索
问题彻底解决