ik php分词,ik中英文混合分词器

本文介绍了如何在Elasticsearch中使用ik_max_word分词器对'中华人民共和国国徽'这样的中英文混合文本进行分词。通过重启Elasticsearch并设置索引模板,确保内容字段使用ik_max_word分词器,同时包含了日期、IP等不同类型的字段映射配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

3、重启Elasticsearch

4、测试分词器

GET /_analyze

{

"text": "中华人民共和国国徽",

# 两种:ik_smart较粗粒度的拆分 和 ik_max_word较细粒度的拆分

"analyzer": "ik_max_word"

}

5、使用分词器 在模版中定义好分词

"settings": {

"index": {

"number_of_shards": "1",

"number_of_replicas": "0"

},

"analysis": {

"analyzer": {

"ik":{

"tokenizer" : "ik_max_word"

}

}

}

},

.......

"mappings": {

"_doc" : {

"dynamic_templates": [

{

"integers": {

"mapping": {

"type": "long"

},

"match

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值