Elasticsearch- 分词查询

本文介绍了如何在Elasticsearch中查看和测试分词效果,包括使用自定义分析器、分词器和过滤器。同时,列举了ES内置的分析器如standard、simple等,并提供了相关链接以获取详细信息。通过curl命令演示了查询特定字段分词的过程,对于理解Elasticsearch的文本处理至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


查看分词的命令, ES配置完成后需要测试分词,看看分词是否达到预期效果。

curl 命令查看:

1. 使用自定义的分析器查看分词:ansj_index_synonym:自定交分析器名称.  pretty :json格式显示

curl -XGET 'http://localhost:8200/zh/_analyze?analyzer=ansj_index_synonym&pretty' -d '童装童鞋'

2. 使用自定义的分词器(tokenizer)和过滤器(filters)查看分词:

curl -XGET 'http://localhost:8200/zh/_analyze?tokenizer=ansj_index&filters=synonym&pretty' -d '童装童鞋'

3. 查询某个字段的分词:

curl -XGET 'http://localhost:8200/zh/_analyze?field=brand_name&pretty' -d '童装童鞋'

“brand_name”:字段名称,如果是字段是nest,object类型,也可以写成"brand_name. name"


除了自定义自己的分析器,ES自己也有内置分析器如:

standard
simple
whitespace
stop
keyword
pattern
language
snowball
custom

具体解释:http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-standard-analyzer.html 

需要英文好点在同鞋。


ES还内置了分词器和过滤器:

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-tokenizers.htmlstandard
edge_ngram
keyword
letter
lowercase
ngram
whitespace
pattern
uax_email_url
path_hierarchy
ascii folding
length
lowercase
uppercase
nGram
edge_ngram
porter_stem
shingle
stop
word_delimiter
stemmer
stemmer_override
keyword_marker
keyword_repeat
kstem
snowball
phonetic
synonym
reverse
elision
truncate
unique
pattern_capture
pattern_replace
trim
limit
hunspell
common_grams
normalization
delimited_payload
keep_words




评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值