哈希表原理初解（hashtable）

基础不牢，地动山摇

于 2020-11-12 16:30:25 发布

阅读量181

点赞数

分类专栏： JAVA 文章标签： java 数据结构

本文链接：https://blog.youkuaiyun.com/qq_41177704/article/details/109643734

版权

JAVA 专栏收录该内容

17 篇文章

订阅专栏

哈希表结构特点

ctrl+alt+左右箭头返回鼠标上次下次焦点

hashtable也叫散列表
特点:快
结构:结构有多种（最常用、最容易理解的结构( JDK1.7 ) :数组+链表
JDK1.8:数组+链表/红黑树(链表长度>=8 )）
最流行、最容易理解:顺序表+链表
主结构:顺序表
每个顺序表的节点在单独引出一个链表

添加与查找数据

计算哈希码(调用hashCode()，结果是一个int值 ,整数的哈希码取自身即可)
计算在哈希表中的存储位置y=k(x)=x%11
x:哈希码
k(x) ：哈希函数
y :在哈希表中的存储位置，y值一样就会出现hash冲突（无法避免）。
存入哈希表
情况1 : 一次添加成功
情况2 :多次添加成功(出现了冲突,调用equals()和对应链表的元素进行比较，比较到最后,结果都是false ,创建新节点,存储数据,并加入链表末尾)
情况3 :不添加(出现了冲突,调用equals(和对应链表的元素进行比较，经过一次或者多次比较后,结果是true ,表明重复,不添加)

结论1 :哈希表添加数据快( 3步即可,不考虑冲突)
结论2 :唯一
结论3:无序
查找也是直接生成哈希码，计算地址，链表查找。

hashCode()和equals()的作用

hashCode():计算哈希码是一个整数.根据哈希码可以计算出数据在哈希表中的存储位置
equals() :添加时出现了冲突。需要通过equals进行比较,判断是否相同
查询时也需要使用equals进行比较，判断是否相同

各基础数据类型hash码

String的hashCode

public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

自定义类重写hashCode方法，会对基本数据类型的hash码通过计算生成类的hash码。

@Override
public int hashCode() {
    int result;
    long temp;
    result = sno;
    result = 31 * result + name.hashCode();
    result = 31 * result + age;
    temp = Double.doubleToLongBits(score);
    result = 31 * result + (int) (temp ^ (temp >>> 32));
    return result;
}

减少哈希冲突

表中的记录数/哈希表的长度=装填因子:
如果Hash表的空间远远大于最后实际存储的记录个数,则造成了很大的空间浪费如果选取小了的话,则容易造成冲突。
在实际情况中, 一般需要根据最终记录存储个数和关键字的分布特点来确定Hash表的大小。
还有一种情况，可能事先不知道最终需要存储的记录个数,则需要动态维护Hash表的容量,此时可能需要重新计算Hash地址。
装填因子=表中的记录数/哈希表的长度
12/16 =0.75
如果装填因子越小，表明表中还有很多的空单元,则添加发生冲突的可能性越小;而装填因子越大.则发生冲突的可能性就越大.在查找时所耗费的时间就越多。
有相关文献证明当装填因子在0.5左右的时候。Hash的性能能够达到最优。因此，一般情况下.装填因子取经验值0.5。
哈希函数的选择
重接定址法、平方取中法折叠法、除留取余法(y= x%11)
处理冲突的方法
链地址法（冲突值以链表方式存储）、开放地址法再散列法、建立一个公共溢出区

Java中HashSet, LinkedHashSet, HashMap. LinkedHashMap. Hashtable底层使用的都是哈希表
JDK1.8之后，哈希表的底层结构发生了变化.如果链表的长度>=8.就会将造表转换为红黑树。目的是为了减少查询比较的次数