在百度搜索框里面,当我们输入某个关键字或关键词的时候,基本上不需要等待多久【秒级】,当然网络太差就不说了,就可以马上列出一大堆相关的词句,这些是怎么实现的呢

总的来说,实现方式有两种,第一种,实时ajax请求后端接口,即鼠标弹起事件触发,但对于数据量特别大的网站基本上不可能;第二种方式就是搜索引擎来实现了,至于百度的搜索引擎是什么样的,我们无从得知,但是和es的搜索原理应该类似,拿到短语或者句子,去数据仓库做实时检索,将检索出来的一系列doc根据得分情况进行排名,然后拿出得分最高的前N条数据展示给用户,原理大概如此
在es中,有哪些方式可以达到类似的效果呢?下面简单分享两种实现此功能的方式
方式一,match_phrase_prefix
1、首先我们创建一个索引,并插入一组有特征意义的数据如下,
PUT /myindex/mytype/1
{
"title":"hello world"
}
PUT /myindex/mytype/2
{
"title":"hello we"
}
PUT /myindex/mytype/3
{
"title":"hello win"
}
PUT /myindex/mytype/4
{
"title":"hello wed"
}
PUT /myindex/mytype/5
{
"title":"hel
ES实现近实时搜索推荐:match_phrase_prefix vs ngram
本文介绍了在ES中实现近实时搜索推荐的两种方法:match_phrase_prefix和ngram。match_phrase_prefix适用于小数据量,但随着短语增长,性能下降。ngram通过预处理数据,提高了搜索效率,尤其适合大数据量场景。
订阅专栏 解锁全文
1779

被折叠的 条评论
为什么被折叠?



