索引的本质就是一个symbol table

本文阐述了索引的本质为符号表结构,详细解释了关键字与文档ID之间的映射关系,并探讨了不同数据结构如平衡树、哈希表等在实现索引时的时间与空间复杂度。
索引的本质就是一个symbol table
key是关键字, value就是docId,或者row locator的一个集合


docId 面对的是存储系统,接收一个docId, 返回对应的doc或记录,一般就是一个堆一样的东西。


索引的概念和任何数据结构无关,起的就是个关联作用(key -> {docId}), 就是一个具体的symbol table的应用(value 是docId集合),可以用任何数据结构实现,平衡树、hash表,trie, 甚至是数组、链表,只是每种数据结构有各自不同的时间和空间复杂度而已,即便用数组实现,查找某个关键字在哪些doc中出现,查索引也比直接一篇一篇读doc快
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值