一、ik、pinyin分词器
今天用通讯录演示ES检索功能,在对姓名检索时,想实现中文和拼音均可检索,于是除之前常用的中文分词器ik外,又下载了拼音分词器pinyin,使用情况总结如下:
1、下载
ik:https://github.com/medcl/elasticsearch-analysis-ik
pinyin:https://github.com/medcl/elasticsearch-analysis-pinyin
2、安装
将下载的文件解压后放入es文件夹plugins下,可新建ik,pinyin文件夹;
其中pinyin分词器我不知为何无法直接下载zip文件,所以是下载的源码然后打包,再解压后放入plugins/pinyin下
3、pinyin分词器测试
GET _analyze?pretty
{
"analyzer": "pinyin",
"text": "刘德华"
}
结果:
{
"tokens": [
{
"token": "liu",
"start_offset": 0,
"end_offset": 0,
"type": "word",
"position": 0
},
{
"