题目描述
小发明家弗里想创造一种新的语言,众所周知,发明一门语言是非常困难的,首先你就要克服一个困难就是,有大量的单词需要处理,现在弗里求助你帮他写一款程序,判断是否出现重复的两个单词。
输入描述
第 1 行,输入 N,代表共计创造了多少个单词。
第 2 行至第 N+1 行,输入 N 个单词。
1≤N≤10^4,保证字符串的总输入量不超过 10^6。
输出描述
输出仅一行。若有重复的单词,就输出重复单词,没有重复单词,就输出 NO
,多个重复单词输出最先出现的。
输入输出样例
示例1
输入
6
1fagas
dsafa32j
lkiuopybncv
hfgdjytr
cncxfg
sdhrest
输出
NO
示例2
输入
5
sdfggfds
fgsdhsdf
dsfhsdhr
sdfhdfh
sdfggfds
输出
sdfggfds
解题思路:
这题虽然给的数据范围比较小,双重循环暴力求解使可以通过的,但是当比赛数据范围很大的时候,暴力就很难收场了,那这个时候也许很多小伙伴说直接用C++STL中的map、set等等去做,但是其时间复杂度是logn的,数据范围再稍大一点是不是还是会被卡住呢,所以,今天听了一个老师讲的用哈希表去做,时间复杂度0(1)。
首先我们自己创建一个哈希函数,在这里我们使用一个国外很经典的哈希函数:
选取两个合适的互质常数h和b,h要尽可能的大,为了降低冲突的概率,b常用的数字是131,h常用的数字是1e9+7,这里我们需要一个公共溢出区,所以我们需要寻找一个string能开出来并且是质数的数,我们就选取999983。
哈希函数设置好之后,我们就对输入的每一个字符串k进行哈希函数运算,计算出每个字符串的散列地址h(k)。若当前的地址中没有字符串,说明该字符串第一次出现,就将该字符串放入哈希表中,若该字符串计算出的散列地址中已经存放了字符串,那我们就看这个字符串是不是和当前字符串一样,一样的话,就说明该字符串是已经出现过,就不能插入,但是如果该地址存放的字符串不是当前字符串,说明还有其他字符串也可以根据哈希函数计算出这个地址,那我们此时就要去公共溢出区中按顺序寻找(因为存放在公共溢出区的字符都是按顺序存放,所以寻找也要按顺序寻找)有没有和当前字符一样的,若有就不能插入,没有就将当前字符存放在公共溢出区。
这样的话,我们就很快的找到了哪些字符是出现多次的啦!
代码:
#include <bits/stdc++.h>
using namespace std;
const int h=999983;
string value[h+5];
string upvalue[h+5];
int upvaluecount;
int hx(string s)
{
int sum=0;
int n=s.length();
for(int i=0;i<n;i++)
{
sum=sum*131%h+(s[i]-'a'+1)%h;
}
return (sum+h)%h;
}
bool in(string s)
{
int n=hx(s);
if(value[n]=="")
{
value[n]=s;
return true;
}
else if(value[n]==s)
{
return false;
}
else
{
for(int i=0;i<upvaluecount;i++)
{
if(upvalue[i]==s)
{
return false;
}
}
upvalue[upvaluecount++]=s;
return true;
}
}
int main()
{
string ans="NO";
int n;
cin>>n;
for(int i=1;i<=n;i++)
{
string s;
cin>>s;
if(!in(s))
{
cout<<s<<endl;
return 0;
}
}
cout<<ans;
return 0;
}