ELF hash

本文介绍了一种字符串Hash算法的实现方式,并提供了详细的C语言模板代码。该算法通过循环移位和位运算操作来生成字符串的Hash值,适用于多种应用场景。

字符串Hash 模板代码


unsigned long
 elf_hash(const unsigned char *name)
  {
      unsigned long       h = 0, g;
  
      while (*name) {
          h = (h << 4) + *name++;
          if (g = h & 0xf0000000)
              h ^= g >> 24;
          h &= ~g;
      }
      return h;
  }


多应用程序,如字处理软件,邮件客户端等,都包含了单词检查特性。单词检查是根据字典,找出输入文本中拼错的单词,我们认为凡是不出现在字典中的单词都是错误单词。不仅如此,一些检查程序还能给出类似拼错单词的修改建议单词。 例如字典由下面几个单词组成: bake cake main rain vase 如果输入文件中有词vake ,检查程序就能发现其是一个错误的单词,并且给出 bake, cake或vase做为修改建议单词。 修改建议单词可以采用如下生成技术: (1)在每一个可能位置插入‘a-'z'中的一者 (2)删除单词中的一个字符 (3)用‘a'-'z'中的一者取代单词中的任一字符 很明显拼写检查程序的核心操作是在字典中查找某个单词,如果字典很大,性能无疑是非常关键的。 你写的程序要求读入字典文件,然后对一个输入文件的单词进行检查,列出其中的错误单词并给出修改建议。 本题要求采用hash技术维护字典,hash的实现必须由同学们编码完成,不能采用C++或JAVA的泛型库。 hash函数建议自行设计一个,然后和成熟的hash函数比较,比如下面的ELF hash函数。 /* UNIX ELF hash * Published hash algorithm used in the UNIX ELF format for object files */ unsigned long hash(char *name) { unsigned long h = 0, g; while ( *name ) { h = ( h << 4 ) + *name++; if ( g = h & 0xF0000000 ) h ^= g >> 24; h &= ~g; } return h; } 另外,请比较线性地址法和链地址法两种冲突处理方法的性能,以及调整hash表大小对性能的影响。 输入 输入分为两部分。 第一部分是字典,每个单词占据一行,最后以仅包含'#'的一行表示结束。所有的单词都是不同的,字典中最多500000个单词。 输入的第二部分包含了所有待检测的单词,单词数目不超过200。每个单词占据一行,最后以仅包含'#'的一行表示结束。 字典中的单词和待检测的单词均由小写字母组成,并且单词最大长度为15。 输出 按照检查次序每个单词输出一行,该行首先输出单词自身。如果单词在字典中出现,接着输出" is correct"。如果单词是错误的,那么接着输出':',如果字典中有建议修改单词,则按照字典中出现的先后次序输出所有的建议修改单词(每个前面都添加一个空格),如果无建议修改单词,在':'后直接换行。
最新发布
06-12
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值