文章目录
一、散列
散列 Hashing
- 构造一个新的数据结构,使得查找算法的复杂度降到O(1),这种概念称为“散列Hashing”
- 由数据项的值来确定其存放位置,数据项应该出现在大概什么位置,就可以直接到那个位置看看数据项是否存在即可
散列表 Hash table
- 散列表又称哈希表,是一种数据集,其中数据项的存储方式尤其有利于将来快速的查找定位
- 散列表中的每一个存储位置,称为槽(slot),可以用来保存数据项,每个槽有一个唯一的名称
- 例如:一个包含11个槽的散列表,槽的名称分别为0~10。在插入数据项之前,每个槽的值都是None,表示空槽
散列函数 Hash function
- 实现从数据项到存储槽名称的转换的,称为散列函数
- 一种常用的散列方法是“求余数”,将数据项除以散列表的大小,得到的余数作为槽号。
示例
- 数据项:54,26,93,17,77,31。使用散列函数求余:
h(item)= item % 11
。按照散列函数h(item),为每个数据项计算出存放的位置之后,就可以将数据项存入相应的槽中 - 槽被数据项占据的比例称为散列表的“负载因子”,这里负载因子为6/11
- 对查找项进行计算,测试返回的槽号所对应的槽中是否有数据项。实现了O(1)时间复杂度的查找算法。
二、完美散列函数
冲突 Collision