elastic search sql 按字段设置分词器

本文介绍了如何在Elasticsearch中按字段配置自定义分词器,通过编辑elasticsearch.yml文件并重启服务。接着展示了创建索引及映射,特别设置了name字段的分词器。此外,还利用Hive创建外部表并与Elasticsearch进行数据同步,实现了从Hive到Elasticsearch的数据导入功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

设置分词器:

vi elasticsearch.yml

index:

    analysis:

        analyzer:

            pattern_analyzer:

                type: custom

                tokenizer: field_tokenizer

        tokenizer:

            field_tokenizer:

                type: pattern

                pattern: ",|:"

                group: -1

重启 ES

创建索引,设置模式:

curl -XPUT '10.199.101.237:9200/test_1?pretty' -d'

{

  "mappings": {

    "crm_2": {

          "properties": {

            "id":  { "type": "integer" },

            "name": { "type": "string", "analyzer": "pattern_analyzer"}

      }

    }

  }

}'


hive 创建表

CREATE EXTERNAL TABLE test_es222  (id INT, name STRING)

STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler'

TBLPROPERTIES('es.resource' = 'test_1/crm_2','es.index.auto.create' = 'true','es.nodes' = '10.199.101.237','es.port' = '9200');



输入数据:


实现功能











评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值