关于C++中Hash的应用

最新推荐文章于 2025-10-15 21:17:08 发布

转载最新推荐文章于 2025-10-15 21:17:08 发布 · 449 阅读

1 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/xiguas/p/9977933.html

文章标签：

#c/c++ #数据结构与算法 #内存管理

本文介绍C++11中unordered_map容器的使用方法，包括当key为内置类型和自定义类型时的不同处理方式。通过示例代码详细展示了如何为自定义类型提供hash函数和等价函数。

本文只介绍我们在C++中如何使用Hash这种数据结构达到我们编程的目的，有关Hash的概念和实现不做详谈。

C++11新增了一类散列容器包括unordered_set, unordered_map, unordered_multiset, unordered_multimap，即之前熟悉的hash_set, hash_map等。

这类容器底层以哈希表实现之，通过unordered_map介绍下这类容器的使用。

unordered_map 是一个模板类，需要我们提供5个魔板参数。依次为：key值的类型， value值的类型，hash函数，等价函数，容器分配器。其中后三个有默认参数，那我们是不是只需要提供前2个模板参数就可以使用了呢？不一定。当我们使用的key为内置类型时（如int, double, float, string等），后面三个默认模板参数在STL内有其特化版本，故可以直接进行使用。可一旦你的类为自定义类型，其中的hash和equal就得由你自己提供。其实也不难理解，假设你的对象是一块石头，石头怎么进行hash, 石头怎么怎么比大小呢？编译器当然不知道，这就需要你告诉编译器。下面我们对这2种情况分别举例说明。

（一）、当key为内置类型：

unordered_map<string, int> m_map;

当key为内置类型，仅需提供key与value的类型便可运用。其中hash<string> 与 equal <int> 均有特化版本，分配器对整个容器进行内存管理，这三个参数均为默认参数。

（二）、当key为自定义类型：

比如我们简单定义一个package类，里面仅有名字，电话2项数据。

class package
{
public:
    string getName() const { return name; }
    long long getPhone() const { return phone; }

    package(string m_name = 0, long long m_pNum = 0);

    bool operator== (const package& p) const
    {    return name == p.name &&
               phone == p.phone; 
    }

private:
    string name;        
    long long phone;        
};

然后将原生hash包装使用下：

namespace std
{
    template<>
    struct hash<package>
    {
        size_t operator() (const package& s) const noexcept
        {
            return  hash<decltype(s.getName())>()(s.getName()) +
                    hash<decltype(s.getPhone())>()(s.getPhone());
        }
    }; // 间接调用原生Hash.
}

或者可以借助借助boost库的hash_value:

 namespace std
 {
     template<>
     struct hash<package>
     {
         size_t operator() (const package& s) const noexcept
         {
             auto t = make_tuple(s.getName(), s.getPhone());                                            
             size_t value = boost::hash_value(t);         
             return value;     // make_tuple(s.getName(), s.getPhone()) 等价于 tuple<string, long long>()(s.getName(), s.getPhone())
          }
     }; // 间接调用原生Hash.
  }

当我们把Hash函数（package的特化版本）和等价函数（操作符==重载）提供后，便可使用自定义版本的unordered_map了:

unordered_map<package, int> m_map;

下面给出测试代码：

（测试环境： VS2017）

#include <iostream>
#include <unordered_map>
#include <string>
#include <algorithm>
//#include <boost/functional/hash.hpp>   // 根据安装路径选择hash.hpp
#include <tuple>

using namespace std;


class package
{
public:
    string getName() const { return name; }
    long long getPhone() const { return phone; }

    package(string m_name = 0, long long m_pNum = 0);

    bool operator== (const package& p) const
    {    return name == p.name &&
               phone == p.phone; 
    }

private:
    string name;        
    long long phone;        
};

package::package(string m_name, long long m_pNum)
    : name(m_name), phone(m_pNum) { }

namespace std
{
    template<>
    struct hash<package>
    {
        size_t operator() (const package& s) const noexcept
        {
            return  hash<decltype(s.getName())>()(s.getName()) +
                    hash<decltype(s.getPhone())>()(s.getPhone());
            
            //auto t = make_tuple(s.getName(), s.getPhone());                                            
            //size_t value = boost::hash_value(t);         
            //return value;     // make_tuple(s.getName(), s.getPhone()) 等价于 tuple<string, long long>()(s.getName(), s.getPhone())
        }
    }; // 间接调用原生Hash.
}

int main()
{
    unordered_map<package, int> m_map;

    package p1{ "Wang", 13399996666};
    package p2{ "Li", 13399993333};
    package p3{ "Zhang", 13399992222};
    package p4{ "Zhou", 13399991111 };
    package p5{ "Wang", 13399996666};
    package p6{ "Wang", 13366669999 };

    m_map[p1]++;
    m_map[p2]++;
    m_map[p3]++;
    m_map[p4]++;
    m_map[p5]++;
    m_map[p6]++;

    cout << m_map.bucket(p1) << " ";
    cout << m_map.bucket(p2) << " ";
    cout << m_map.bucket(p3) << " ";
    cout << m_map.bucket(p4) << " ";
    cout << m_map.bucket(p5) << " ";
    cout << m_map.bucket(p6) << " " << endl;

    return 0;
}

转载于:https://www.cnblogs.com/xiguas/p/9977933.html