因为下学期要学数据结构,就先看算法导论的这个部分。
栈,队列,树,链表都很简单,以前学过,就不关注了。
然后看散列表,很郁闷,比较难懂。连续看了好几天,又在网上搜了别人的文章,总算有所了解。
就写个学习笔记。
散列表,是一种数据结构,主要用于快速查找。
结构可以这样定义:
struct hashnode{
keytype key; //关键字数据类型可为任意
othertype other; //可包含其他数据,如链表头指针
};
hashnode hashtable[10];
其可以快速查找的原因是使用hash函数,对关键字k进行直接寻址即hashtable[i],i=h(k),则可在期望为o(1)的时间内进行字典操作。
常用的hash函数:
这里的hash函数要满足两个要求:简单,计算hashtable下标时不能过于复杂,否则会影响执行效率;均匀,任何元素散列到任何位置都应该是独立等可能的,尽量避免冲突。
1) 除余法: h(k) = k mod m
2) 相乘取整: h(k) = [m(kA mod 1)] 此次为向下取整,我不知道怎么打出那个符号,就像L型。
这里的A可取一个很有意思的较理想值,(√5-1)/2≈0.618,黄金比例。感觉蛮神奇的。
3) 平方取中法
4) 随机数法
5) 全域散列
散列表的一个重要问题就是碰撞,即两个不同的元素被散列到相同的槽中。
解决这个问题主要有两种方法:链表法和开放寻址法。
链表法就是将所有散列到相同槽中的元素构成一个链表,较简单但效率低下。
开放寻址是为每个关键字构造一个探查序列,若产生冲突则按照探查序列依次存放。依据我的理解,可以打个比方:比如有A,B两个人。3张椅子1、2、3。A期望坐的椅子顺序为213,B的为231。A被分配去坐2号椅子。B也被分配去坐2号椅子。可A已经占了这个位置。于是B就按照他期望的顺序坐到了3号椅子。当查找B时,就先看B被分配的地方,发现是A,再按顺序找下去,就能在3号椅子发现B。
开放寻址有三种方法:线性探查,二次探查和双重散列。双重散列是比较好的方法。
对其进行的字典操作,都是建立在寻址的基础之上。就不多赘述了。
当然,上面的文字只是我看了两天算法导论的小理解,偏颇和错误是难免的。以后会进一步修改和补完。