散列的基本思想是在空间和时间上取得一个平衡,尤其适用于key稀疏的情形。
用户可以用O(1)的时间查找到需要的条目,同时数据储存占用的空间不至于太大。
特别的,当可能的key有n1种时,储存空间为n2(n2<n1且为质数),实际放进去的元素数目为m,
则空间利用率为m/n2。
散列储存的数据较多时,不同key的元素可能会占据相同位置,一般的做法是进行偏移,这就意味着用户确认是否存在某一元素时可能需要几次跳转直至查找到空值才能确认不存在,为了确保用户能够查找到空值,必须确保一定的填充因子,即无法充分利用n2的空间。
这时,哈希桶是一个不错的解决方案。
所谓哈希桶,是指储存空间分为两个部分,第一部分只储存n2个指针,即将数目分成n2类,第二部分以链表形式储存实际数据。
这样的好处在于,可以充分利用空间,同时也可以利用散列进行数据分类,查找/插入/删除的性能与普通散列一致。
在某种程度上可以看成数据的高维储存,类似多维数组。
1977

被折叠的 条评论
为什么被折叠?



