关于hash

问题:为什么Hash表的size总是扩展成一个素数?

分析:素数可以有效地减少冲突。具体原因如下
 假设Hash表的大小为size,这是一个合数,即有size = a * n,当有Hash值为HashCode = b * n,则
 HashCode取模之后有:
             HashCode = HashCode mod size
                      = HasdCode - HashCode/size * size
                      = HashCode - b/a *size        
 因为是固定不变的,那么HashCode取值就有了种可能,这样显然会增加冲突的概率。

ELF hash字符串hash函数

// ELF Hash Function
unsigned int ELFHash(char *str)
{
    unsigned int hash = 0;
    unsigned int x = 0;

    while (*str)
    {
        hash = (hash << 4) + (*str++);//hash左移4位,把当前字符ASCII存入hash低四位。 
        if ((x = hash & 0xF0000000L) != 0)
        {
            //如果最高的四位不为0,则说明字符多余7个,现在正在存第7个字符,如果不处理,再加下一个字符时,第一个字符会被移出,因此要有如下处理。
            //该处理,如果最高位为0,就会仅仅影响5-8位,否则会影响5-31位,因为C语言使用的算数移位
            //因为1-4位刚刚存储了新加入到字符,所以不能>>28
            hash ^= (x >> 24);
            //上面这行代码并不会对X有影响,本身X和hash的高4位相同,下面这行代码&~即对28-31(高4位)位清零。
            hash &= ~x;
        }
    }
    //返回一个符号位为0的数,即丢弃最高位,以免函数外产生影响。(我们可以考虑,如果只有字符,符号位不可能为负)
    return (hash & 0x7FFFFFFF);
}

BKDR 字符串hash函数

unsigned int BKDRHash(char*str)   
{   
    unsigned int seed=131 ;// 31 131 1313 13131 131313 etc..    
    unsigned int hash=0 ;   

    while(*str)   
    {   
        hash=hash*seed+(*str++);   
    }   

    return(hash % SIZE);   
}   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值