<C/C++数据结构>散列表（C++模板实现）

最新推荐文章于 2023-07-28 16:30:52 发布

EbowTang

最新推荐文章于 2023-07-28 16:30:52 发布

阅读量2k

点赞数 1

CC 4.0 BY-SA版权

文章标签： C++ 散列函数二分查找设计 hash

本文链接：https://blog.youkuaiyun.com/EbowTang/article/details/43115801

本文深入探讨了散列表的基本概念，包括冲突现象及其解决方法，并提供了C++模板实现的示例代码，详细解释了散列表的构造、插入、搜索操作，以及如何通过哈希函数和冲突处理来优化查找效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考资源：

http://student.zjzk.cn/course_ware/data_structure/web/CHAZHAO/chazhao9.4.1.htm

一，散列表的基本概念

散列方法不同于顺序查找、二分查找、二叉排序树及B-树上的查找。它不以关键字的比较为基本操作，采用直接寻址技术。在理想情况下，无须任何比较就可以找到待查关键字，查找的期望时间为O(1)。

1、散列表
　设所有可能出现的关键字集合记为U(简称全集)。实际发生(即实际存储)的关键字集合记为K（|K|比|U|小得多）。
　散列方法是使用函数h将U映射到表T[0..m-1]的下标上（m=O(|U|)）。这样以U中关键字为自变量，以h为函数的运算结果就是相应结点的存储地址。从而达到在O(1)时间内就可完成查找。
其中：
　 ① h：U→{0，1，2，…，m-1} ，通常称h为散列函数(Hash Function)。散列函数h的作用是压缩待处理的下标范围，使待处理的|U|个值减少到m个值，从而降低空间开销。
　② T为散列表(Hash Table)。
　③ h(Ki)(Ki∈U)是关键字为Ki结点存储地址(亦称散列值或散列地址)。
　④ 将结点按其关键字的散列地址存储到散列表中的过程称为散列(Hashing)

2、散列表的冲突现象
（1）冲突
　两个不同的关键字，由于散列函数值相同，因而被映射到同一表位置上。该现象称为冲突(Collision)或碰撞。发生冲突的两个关键字称为该散列函数的同义词(Synonym)。
　【例】上图中的k2≠k5，但h(k2)=h(k5)，故k2和K5所在的结点的存储地址相同。

（2）安全避免冲突的条件
　最理想的解决冲突的方法是安全避免冲突。要做到这一点必须满足两个条件：
①其一是|U|≤m
②其二是选择合适的散列函数。
　这只适用于|U|较小，且关键字均事先已知的情况，此时经过精心设计散列函数h有可能完全避免冲突。

（3）冲突不可能完全避免
　通常情况下，h是一个压缩映像。虽然|K|≤m，但|U|>m，故无论怎样设计h，也不可能完全避免冲突。因此，只能在设计h时尽可能使冲突最少。同时还需要确定解决冲突的方法，使发生冲突的同义词能够存储到表中。

（4）影响冲突的因素
　冲突的频繁程度除了与h相关外，还与表的填满程度相关。

　设m和n分别表示表长和表中填人的结点数，则将α=n/m定义为散列表的装填因子(Load Factor)。α越大，表越满，冲突的机会也越大。通常取α≤1。

二，C++模板实现

（1）HashTable.h代码如下：

<span style="font-size:12px;">#include "stdafx.h"  
#include "iostream"  
using namespace std;  
  
template<class DataType>   
class HashTable  
{  
public:  
    HashTable(int size)  
    {  
        maxSize=size;  
        count=0;  
        element =new DataType[size];  
        if (element == NULL)  
        {  
            exit(1);  
        }else  
        {  
            for (int i=0;i<size;i++)  
            {  
                element[i]=NULL;  
            }  
        }  
    }  
    ~HashTable()  
    {  
        delete[] element;  
    }  
    DataType getData(int i)  
    {  
        if (i < 0 || i >= maxSize)  
        {  
            exit(1);  
        }else  
        {  
            return element[i];  
        }  
          
    }  
  
    int getNum()  
    {  
        return count;  
    }  
    //哈希函数，返回ndata的(在数组中的)存储位置  
    int Hash(DataType nData);  
    //插入操作,插入newData到哈希表中  
    int insertHash(DataType newData);  
    //搜寻nData的当前存储位置  
    int getHash(DataType nData);  
private:  
    int maxSize;  
    int count;  
    DataType *element;  
};  
  
  
template<class DataType>  
int HashTable<DataType>::Hash(DataType newData)  
{  
    return newData%maxSize;//留余数法  
}  
  
//搜索nData的空白存储位置  
template<class DataType>  
int HashTable<DataType>::insertHash(DataType newData)  
{  
    if (getNum() == maxSize)  
    {  
        cerr<<"哈希表已经满"<<endl;  
    }  
    int pos=Hash(newData);  
    if (element[pos] == NULL)  
    {  
        element[pos]=newData;  
        count++;  
        return 1;  
    }else  
    {  
        int rpos=(pos+1)%maxSize;  
        while (rpos != pos)  
        {  
            if (element[rpos] == NULL)//寻找没有存储数据的位置  
            {  
                element[rpos]=newData;  
                count++;  
                return 1;  
            }  
            rpos=(rpos+1)%maxSize;  
        }  
  
        if (rpos == pos)//如果最终都没能找到空位，直接强行赋值  
        {  
            element[rpos]=newData;  
            count++;  
            return 1;  
        }  
    }  
}  
  
//搜寻nData的当前存储位置  
template<class DataType>  
int HashTable<DataType>::getHash(DataType newData)  
{  
    int pos=Hash(newData);  
    if (element[pos] == newData)  
    {  
        return pos;  
    }else  
    {  
        int rpos=(pos+1)%maxSize;  
        while (rpos != pos)  
        {  
            if (element[rpos] == newData)  
            {  
                return rpos;  
            }  
            rpos=(rpos+1)%maxSize;  
        }  
        if (rpos == pos)  
        {  
            cerr<<"无法查找指定元素的存储位置"<<endl;  
            return -1;  
        }else  
        {  
            return rpos;  
        }  
    }  
} </span><span style="font-size: 14px;"> </span>

（2）主测试代码如下：

<span style="font-size:12px;">// ConsoleAppHashTable.cpp : 定义控制台应用程序的入口点。  
//  
  
#include "stdafx.h"  
#include "HashTable.h"  
#include "iostream"  
using namespace std;  
  
int _tmain(int argc, _TCHAR* argv[])  
{  
    int len=10;  
    HashTable<int> hashTest(len);  
    //一次插入元素  
    hashTest.insertHash(10);  
    hashTest.insertHash(1);  
    hashTest.insertHash(9);  
    hashTest.insertHash(5);  
    hashTest.insertHash(5);  
    hashTest.insertHash(2);  
    hashTest.insertHash(18);  
    hashTest.insertHash(65);  
    hashTest.insertHash(21);  
    //输出哈希表中的元素  
    cout<<"表中的元素为：   ";  
    for (int i=0;i<len;i++)  
    {  
        cout<<hashTest.getData(i)<<"  ";  
    }  
    cout<<endl;  
    //查找元素位置  
    cout<<"元素9的位置：";  
    int pos=hashTest.getHash(9);  
    if (pos == -1)  
    {  
        cout<<"无此元素"<<endl;  
    }else  
    {  
        cout<<pos<<endl;  
    }  
    system("pause");  
    return 0;  
} </span>

(3)测试结果：