浅谈ES以及索引的本质

目录

ES——elasticsearch

全文检索引入ES——倒排索引


ES——elasticsearch

应用场景:海量数据情况下的搜索。

什么是索引?索引的本质

空间换时间

帮助快速检索

以数据结构为载体(mysql以b+树为数据结构)

以文件的形式落地

为什么es比mysql适合做搜索?

mysql在超过百万千万数据量的情况下,搜索性能堪忧

mysql的索引数据结构:B+树,当层级越来越深的时候,性能也会下降。

单个node节点的体积越小,一层相对来说可以装更多个节点。

当以ID为索引的时候,确实如此。但是如果以文本(类似于文章的内容详情content)作为索引,它的大小必不可能小。性能也就下去了。

全文检索引入ES——倒排索引

倒排索引的建立过程:

1切词:把一句话切成一个一个词

2规范化:类似于去掉am这样的无用词,do和Doing直接划分为Do

3去重:顾名思义

4字典序:排的是id,放的是int数组

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值