为什么存在散列表

最新推荐文章于 2022-10-28 16:24:52 发布

转载最新推荐文章于 2022-10-28 16:24:52 发布 · 257 阅读

文章标签：

#hash #散列表

数据结构与算法同时被 2 个专栏收录

8 篇文章

订阅专栏

数据结构与算法

6 篇文章

订阅专栏

为什么存在散列表

数组的时间复杂度

INSERT 时间复杂度：

空间足够： 直接添加在后面，时间复杂度为O(1)，空间不足：整个数组移到另一个空间，再添加元素。总的时间复杂度：O(1)+O(n)=O(n)

SEARCH时间复杂度：

按顺序查找最坏时间复杂度：O(n)

DELETE时间复杂度：

   使用顺序查找找到删除位置，再把删除位置后的所有元素前移一位。 总时间复杂度:O(n)+O(n)=O(2n)

UPDATE 时间复杂度：

   顺序查找到数据后，进行修改。时间复杂度为O(n)。

数组必须事先定义固定的长度，不能适应数据动态地增减的情况。当数据增加时，可能超出原先定义的元素个数；当数据减少时，造成内存浪费。

链表的时间复杂度

在这里插入图片描述
链表动态地进行存储分配，可以适应数据动态地增减的情况。

数组和链表在存储数据方面到底孰优孰劣呢？

根据数组和链表的特性，分两类情况讨论。

一、当进行数据查询时，数组可以直接通过下标迅速访问数组中的元素。而链表则需要从第一个元素开始一直找到需要的元素位置，显然，数组的查询效率会比链表的高。

二、当进行增加或删除元素时，在数组中增加一个元素，需要移动大量元素，在内存中空出一个元素的空间，然后将要增加的元素放在其中。同样，如果想删除一个元素，需要移动大量元素去填掉被移动的元素。而链表只需改动元素中的指针即可实现增加或删除元素。

那么，我们开始思考：有什么方式既能够具备数组的快速查询的优点又能融合链表方便快捷的增加删除元素的优势？HASH呼之欲出。所谓的hash，简单的说就是散列，即将输入的数据通过hash函数得到一个key值，输入的数据存储到数组中下标为key值的数组单元中去。我们发现，不相同的数据通过hash函数得到相同的key值。这时候，就产生了hash冲突。解决hash冲突的方式有两种。一种是挂链式，也叫拉链法。挂链式的思想在产生冲突的hash地址指向一个链表，将具有相同的key值的数据存放到链表中。另一种是建立一个公共溢出区。将所有产生冲突的数据都存放到公共溢出区，也可以使问题解决。

参考： https://www.jianshu.com/p/9bbb14b34645