目录
ES——elasticsearch
应用场景:海量数据情况下的搜索。
什么是索引?索引的本质
空间换时间
帮助快速检索
以数据结构为载体(mysql以b+树为数据结构)
以文件的形式落地
为什么es比mysql适合做搜索?
mysql在超过百万千万数据量的情况下,搜索性能堪忧
mysql的索引数据结构:B+树,当层级越来越深的时候,性能也会下降。
单个node节点的体积越小,一层相对来说可以装更多个节点。
当以ID为索引的时候,确实如此。但是如果以文本(类似于文章的内容详情content)作为索引,它的大小必不可能小。性能也就下去了。
全文检索引入ES——倒排索引
倒排索引的建立过程:
1切词:把一句话切成一个一个词
2规范化:类似于去掉am这样的无用词,do和Doing直接划分为Do
3去重:顾名思义
4字典序:排的是id,放的是int数组