下载
从github-ik下载插件代码包,解压到elasticsearch的plugin目录下,然后重启服务。
ik_smart和ik_max_word
ik_smart为最小切分,ik_max_word为最细粒度切分,区别在于把ik_smart的结果全部拼接起来还是原词组,而ik_max_word不是(可能会有字重复)。
ik_smart
使用kibana打开console输入:
GET _analyze
{
"analyzer": "ik_smart",
"text": ["南京大学软件学院"]
}
执行可以看到:
{
"tokens" : [
{
"token" : "南京大学",
"start_offset" : 0,
"end_offset" : 4,
"type" : "CN_WORD",
"position" : 0
},
{
"token" : "软件",
"start_offset" : 4,
"end_offset" : 6,
"type" : "CN_WORD",
"position" : 1
},
{
"token" : "学院",
"start_offset" : 6,
"end_offset" : 8,
"type" : "CN_WORD",
"position" : 2
}