目录
🌈前言
本篇文章学习C++STL< unordered_map和unordered_set >的模拟实现!!!
🚁1、哈希表的改造
- 模板参数列表的改造
// 哈希桶节点
template <typename T>
struct HashNode
{
public:
HashNode(const T& data)
: _data(data)
, _next(nullptr)
{
}
public:
T _data;
HashNode<T>* _next;
};
// Unordered_set -> HashTable<K, Key, KeyOfT, hashF>
// Unordered_map -> HashTable<K, pair<K, V>, KeyOfT, hashF>
template <typename K, typename T, typename KeyOfT, typename hashF>
class HashTable
{
};
模板参数解析:
-
K:关键码(Key)的类型
-
T:不同的容器,T的类型就不相同。如果是unordered_map,T代表一个键值对,如果是unordered_set,T代表一个关键码(Key)
-
KeyOfT:因为V的类型不同,通过value取key的方式就不同,详细见unordered_map/set的实现
-
hashF: 哈希仿函数,哈希函数使用除留余数法,需要将Key转换为整形数字才能取模
- 增加迭代器操作
迭代器:
-
哈希桶的迭代器是单向的,因为它的底层是一个链表,只有指向下一个节点的指针
-
迭代器需要访问哈希桶中的私有成员,需要将迭代器设置成友元类
-
迭代器需要定义在哈希桶前面,但是迭代器需要访问哈希桶的私有成员,因为程序是从当前位置向上开始找哈希桶在不在,所有我们需要前置声明一下哈希桶类
namespace BUCKetHash
{
// 前置声明,迭代器需要访问哈希桶类的私有成员
template <typename K, typename T, typename KeyOfT, typename hashF>
class HashTable;
// 迭代器
template <typename K, typename T, typename KeyOfT, typename hashF>
class HTIterator
{
private:
typedef HashNode<T> Node; // 哈希表节点
typedef HashTable<K, T, KeyOfT, hashF> HT; // 哈希表
typedef HTIterator<K, T, KeyOfT, hashF> Self; // 迭代器本身
public:
HTIterator(Node* _node, HT* _ht)
: node(_node)
, ht(_ht)
{
}
HTIterator(const HTIterator& hti)
: node(hti.node)
, ht(hti.ht)
{
}
Self& operator++()
{
// 如果传过来的节点指针不为空,则直接跳到下一个节点
if (node->_next != nullptr)
{
node = node->_next;
}
// 当前节点为空,找下一个桶
else
{
KeyOfT kot;
hashF hf;
// 计算这个节点映射到桶的位置
size_t hashi = hf(kot(node->_data));
hashi %= ht->_tables.size();
++hashi; // 当前桶已经遍历完,需要对hashi进行自增
// 遍历判断其他哈希桶是否为空,不为空则返回这个桶的指针
for (; hashi < ht->_tables.size(); ++hashi)
{
if (ht->_tables[hashi] != nullptr)
{
node = ht->_tables[hashi];
break;
}
}
// 映射位置等于有效数据时,说明已经越界(走到尾的情况)
if (hashi == ht->_tables.size())
{
node = nullptr;
}
}
return *this;
}
// 后置++,先使用后自增
Self operator++(int)
{
Self tmp(this);
++(*this);
return tmp;
}
T& operator*()
{
return node->_data;
}
T* operator->()
{
return &(node->_data);
}
bool operator!=(const HTIterator& hti) const
{
return node != hti.node;
}
bool operator==(const HTIterator& hti) const
{
return node == hti.node;
}
public:
Node* node; // 哈希节点指针
HT* ht; // 哈希表指针(this)
};
}
哈希桶迭代器自增图解:
- 增加通过key获取value操作
-
哈希桶节点的模板类型T是不确定的,是unordered_map的时候是键对值(pair<K, V>),而unordered_set只是一个关键码(Key)
-
所以我们需要建立一个仿函数将它们进行区分(开头有讲到)
unordered_map:
namespace Myself
{
template <typename K, typename V, typename hashF = BUCKetHash::HashDF<K>>
class unordered_map
{
private:
struct MapKeyOfT
{
const K& operator()(const pair<K, V>& kv)
{
return kv.first;
}
private:
BUCKetHash::HashTable<K, pair<K, V>, MapKeyOfT, hashF> ht;
};
}
unordered_set:
namespace Myself
{
template <typename K, typename hashF = BUCKetHash::HashDF<K>>
class unordered_set
{
private:
struct SetKeyOfT
{
const K& operator()(const K& key)
{
return key;
}
private:
BUCKetHash::HashTable<K, K, SetKeyOfT, hashF> ht;
};
}
- 增加通过哈希函数转换无符号整形操作
对关键码进行转换:
- 因为哈希桶需要对该关键码映射对应的位置,所有需要把该关键码统一修改
namespace BUCKetHash
{
// 仿函数:处理特殊的Key值问题 -- 后面需要对数据进行无符号整形转换
template <typename K>
struct HashDF
{
size_t operator()(const K& key)
{
return static_cast<size_t>(key);
}
};
template <>
struct HashDF<string>
{
size_t operator()(const string& str)
{
size_t HDS = 0;
for (auto& e : str)
{
HDS = HDS * 131 +