由于elasticsearch-analysis-hanlp需要版本适配,最新版支持Elasticsearch 7.10.2,而kibana也必须和Elasticsearch版本对应,所以本文使用的版本都为7.10.2。
一、Elasticsearch下载安装
官网地址:Download Elasticsearch | Elastic
找到 Elasticsearch 7.10.2
下载完成后解压,双击elasticsearch.bat即可启动
访问http://localhost:9200/ 显示如下信息表示启动成功
二、kibana下载安装
官网地址:Download Kibana Free | Get Started Now | Elastic
找到kibana 7.10.2
下载完成后解压,修改配置文件kibana.yml
将elasticsearch.hosts注释取消
双击kibana.bat 即可启动
访问http://localhost:5601/ 显示如下界面表示启动成功
三、elasticsearch-analysis-hanlp下载安装
官网地址:elasticsearch-analysis-hanlp: HanLP Analyzer for Elasticsearch
进入分享的网盘链接(链接:https://pan.baidu.com/s/1mFPNJXgiTPzZeqEjH_zifw 密码:i0o7)
下载elasticsearch-analysis-hanlp-7.10.2
解压后修改配置文件plugin-security.policy的权限,修改为以下内容
grant {
permission java.security.AllPermission;
};
将 elasticsearch-analysis-hanlp-7.10.2中的data文件夹移入elasticsearch-7.10.2的data下,结构如下
将elasticsearch-analysis-hanlp-7.10.2中的config文件夹移入elasticsearch-7.10.2的config下,并将第二层的config文件夹重命名为analysis-hanlp(这里的analysis-hanlp名称不可更改,否则重启会报错),结构如下
修改配置文件hanlp.properties中的root选项
将elasticsearch-analysis-hanlp-7.10.2中除data和config以外的其他文件移入elasticsearch-7.10.2的plugins/analysis-hanlp下(这里需要在plugins内新建一个文件夹analysis-hanlp,再将插件放进analysis-hanlp里,否则启动会报错,这里的analysis-hanlp名称可以任意),结构如下
重启Elasticsearch,使hanlp分词器生效
四、hanlp分词器测试
访问http://localhost:5601/ 进入开发工具页面
输入以下内容,测试分词效果
GET _analyze
{
"text":"我爱北京天安门",
"analyzer":"hanlp"
}
执行后内容如下表示分词成功
五、elasticsearch-analysis-pinyin下载安装
官网地址:https://github.com/medcl/elasticsearch-analysis-pinyin
找到elasticsearch-analysis-pinyin-7.10.2下载
下载完解压后,在elasticsearch-7.10.2的plugins下新建一个文件夹pinyin,将解压的插件放进去,结构如下
重启Elasticsearch,使拼音分词器生效
六、拼音分词器测试
在kibana开发工具页面输入 以下内容,测试分词效果
GET _analyze
{
"analyzer": "pinyin",
"text": "天安门"
}
执行后内容如下表示分词成功