哈希(蛤铪)

本文介绍了哈希的基本概念,包括哈希的定义和作用,详细讲解了如何通过取模和自然溢出两种方法实现哈希函数,并探讨了哈希在判断字符串相等时的应用。此外,还分享了哈希技巧,如快速计算子串哈希值和双哈希策略,以应对数据挑战。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

哈希

——————————18.5.14更新

——————————18.5.15更新 哈希的判断

哈希是神马东西呢。。。。简单来说它是一个函数啦。。。就这么样(好难呀)

哈希的简介

它是将一个复杂的字符串用一个函数将它映射成一个数字的过程。哈希的函数有很多,也很玄学,因为它看起来很容易错,有很多反例,但是它就是不错。它主要用于判断两个字符串是否相等,具体地实现是判断两个字符的哈希函数的值是否一样即可。

哈希的函数

一下函数都是针对一个字符串A的:(其中pp是质数,len为字符串长度,cntAicntAi为该位字符在该字符串中出现次数)

hash(A)=i=1lenAipihash(A)=∑i=1lenAi∗pi

hash(A)=i=1lenAiplenihash(A)=∑i=1lenAi∗plen−i

还有一个特殊的一个函数:
hash(A)=i=1lenAipcntAihash(A)=∑i=1lenAi∗pcntAi

两个字符串的hash值相同,我们就可以认为两个字符串相等。

具体实现哈希的方法

1.取模

首先我们要取两个很棒的质数p,mod,p表示哈希函数中的p,mod是hash函数的取模(因为哈希函数的值十分大,取模才能比较大小,而且mod比p的选取更加重要)
这里介绍几个很棒的质数:(mod=1234321237,998244353)(p=1e9+7,1e9+9)
代码:

long long hash[maxn],p,mod;//longlong避免溢出 
void gethash(string a){
    int i,len=a.length();
    hsh[0]=a[0];
    for(i=1;i<len;i++)
        hsh[i]=((hsh[i-1]*p)%mod+a[i])%mod;//计算从首位到该位构成的子串的hash值 
}

2.自然溢出(稍微比取模好)

运用longlong有上限的功能,将hash值模longlong的上限,常数更小。(要用到unsigned long long,因为它取不到负数)
代码:

unsigned long long hash[maxn],p;//unsigned long long 取不到负数 
void gethash(string a){
    int i,len=a.length();
    hsh[0]=a[0];
    for(i=1;i<len;i++)
        hsh[i]=hsh[i-1]*pa[i];//计算从首位到该位构成的子串的hash值 
}

哈希的技巧

1.O1O(1)计算A中A[l]至A[r]的hash值

想一想我们之前算出的hash值储存方式中每个数组的值是什么?:

hash(k)=i=1kaiplenihash(k)=∑i=1kai∗plen−i

hash(l,r)=i=lraipri=i=1raiprii=1laipliprlhash(子串(l,r))=∑i=lrai∗pr−i=∑i=1rai∗pr−i−∑i=1lai∗pl−i∗pr−l

可推得:
hash(l,r)=hashrhash(l1)prlhash(子串(l,r))=hash(r)−hash(l−1)∗pr−l

而p的次幂可以数组预处理储存,就O1O(1)计算了。在线计算是OlognO(logn)
当然,也可以推得前面另一种hash函数的A[l]-A[r]的值,不过要求出逆元,要复杂一些(玄学出错)。

2.双哈希

有些题的数据很强,哈希很容易被卡(哈希很玄学),所以要用到它。顾名思义,即蛤两次,比较两个hash值的大小即可。注意两个hash函数的mod必须不一样。

这些就是hash的内容了,以后应该会更哈希树的内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值