ElasticSearch —— 中文分词器 IK

本文详细介绍了如何在ElasticSearch中安装和使用中文分词器,包括从下载分词器到通过elasticsearch-plugin命令进行安装的全过程,并演示了如何在Kibana中测试分词器的效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前文

ElasticSearch 简介

ElasticSearch 下载、安装

中文分词器下载

下载 elasticsearch-analysis 中文分词器,下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases/

在这里插入图片描述

安装中文分词器

elasticsearch-plugin

elasticsearch 提供了一个安装插件的批处理文件,该 elasticsearch-plugin 文件在 elasticsearch 的 bin 目录中,该文件可以安装我们的中文分词器插件
在这里插入图片描述

安装

进入到 elasticsearch 的安装目录,cd 进入 bin 目录,执行以下命令安装中文分词器插件

elasticsearch-plugin install file:\\\\你下载的中文分词器压缩包路径

如:elasticsearch-plugin install file:\\\\E:\Software\elasticsearch-analysis-ik-6.2.2.zip

出现以下信息表示插件已经安装成功了
在这里插入图片描述
不想下载直接线上安装的也可以使用以下命令进行安装:

elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/版本号(如:v6.2.2/版本(如:elasticsearch-analysis-ik-6.2.2.zip)

使用中文分词器

先后启动 elasticsearch 和 kibana

在 kibana 界面点击 Dev tools 在控制台中输入以下代码:

GET _analyze
{
  "analyzer":"ik_max_word",
  "text":"铠甲勇士" // 这里的内容可随意输入
}

在这里插入图片描述

IK中文分词器Elasticsearch上的使用。原生IK中文分词是从文件系统中读取词典,es-ik本身可扩展成从不同的源读取词典。目前提供从sqlite3数据库中读取。es-ik-plugin-sqlite3使用方法: 1.elasticsearch.yml中设置你的sqlite3词典的位置:ik_analysis_db_path: /opt/ik/dictionary.db 我提供了默认的词典:https://github.com/zacker330/es-ik-sqlite3-dictionary 2. 安装(目前是1.0.1版本)./bin/plugin -i ik-analysis -u https://github.com/zacker330/es-ik-plugin-sqlite3-release/raw/master/es-ik-sqlite3-1.0.1.zip 3. 现在可以测试了:     1. 创建index curl -X PUT -H "Cache-Control: no-cache" -d '{     "settings":{         "index":{             "number_of_shards":1,             "number_of_replicas": 1         }     } }' 'http://localhost:9200/songs/'      2. 创建map: curl -X PUT -H "Cache-Control: no-cache" -d '{         "song": {             "_source": {"enabled": true},             "_all": {                 "indexAnalyzer": "ik_analysis",                 "searchAnalyzer": "ik_analysis",                 "term_vector": "no",                 "store": "true"             },             "properties":{                 "title":{                     "type": "string",                     "store": "yes",                     "indexAnalyzer": "ik_analysis",                     "searchAnalyzer": "ik_analysis",                     "include_in_all": "true"                 }             }         } }     ' 'http://localhost:9200/songs/_mapping/song'       3.curl -X POST  -d '林夕为我们作词' 'http://localhost:9200/songs/_analyze?analyzer=ik_analysis' response: {"tokens":[{"token":"林夕","start_offset":0,"end_offset":2,"type":"CN_WORD","position":1},{"token":"作词","start_offset":5,"end_offset":7,"type":"CN_WORD","position":2}]} 标签:中文分词  分词插件
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值