以散列表为基础的关联式容器深受人们的喜欢,虽然它们目前还不是STL的标准,但是SGI的STL已经包含了这些内容。
前面学习的关联式容器都是基于红黑树这样一种二叉搜索树,也正因为这样,如果要求搜索时间具有对数平均时间,那么需要数据有足够的随机性。而哈希表这种数据结构,在插入、删除、搜索等操作也具有“常数平均时间”的表现,而这种表现是以统计为基础的,不需要依赖数据输入的随机性。
相信大家对散列函数是比较熟悉的,它的作用是将使用某种函数将大数映射到小数空间。常见的散列函数是取模法。
使用散列函数,可能会将不同的元素 映射到相同的位置上,因此就引发了所谓的碰撞问题。解决碰撞问题的经典方法有:线性探测、二次探测、开链等。现在我们一一来了解一下这些方法
1、线性探测
负载系数:元素个数除以表格大小,除非采用开链,否则负载系数永远在0-1之间。
线性探测的插入:如计算出的这个位置上有元素,那么循序往下找,知道一个空位置,如果表格到底了,那么就绕到头部继续查找。
线性探测的搜索:和插入操作一样,当遇到空位置还未找到的话,则查找失败。