C++之模拟实现＜unordered_set/map＞及位图和布隆过滤器-优快云博客

本文链接：https://blog.youkuaiyun.com/weixin_59400943/article/details/127016741

🌈前言

本篇文章学习C++STL< unordered_map和unordered_set >的模拟实现！！！

🚁1、哈希表的改造

模板参数列表的改造

// 哈希桶节点
template <typename T>
struct HashNode
{
   
public:
	HashNode(const T& data)
		: _data(data)
		, _next(nullptr)
	{
   }
public:
	T _data;
	HashNode<T>* _next;
};

// Unordered_set -> HashTable<K, Key, KeyOfT, hashF>
// Unordered_map -> HashTable<K, pair<K, V>, KeyOfT, hashF>

template <typename K, typename T, typename KeyOfT, typename hashF>
class HashTable
{
   };

模板参数解析：

K：关键码（Key）的类型
T：不同的容器，T的类型就不相同。如果是unordered_map，T代表一个键值对，如果是unordered_set，T代表一个关键码（Key）
KeyOfT：因为V的类型不同，通过value取key的方式就不同，详细见unordered_map/set的实现
hashF: 哈希仿函数，哈希函数使用除留余数法，需要将Key转换为整形数字才能取模

增加迭代器操作

迭代器：

哈希桶的迭代器是单向的，因为它的底层是一个链表，只有指向下一个节点的指针
迭代器需要访问哈希桶中的私有成员，需要将迭代器设置成友元类
迭代器需要定义在哈希桶前面，但是迭代器需要访问哈希桶的私有成员，因为程序是从当前位置向上开始找哈希桶在不在，所有我们需要前置声明一下哈希桶类

namespace BUCKetHash
{
   
	// 前置声明，迭代器需要访问哈希桶类的私有成员
	template <typename K, typename T, typename KeyOfT, typename hashF>
	class HashTable;

	// 迭代器
	template <typename K, typename T, typename KeyOfT, typename hashF>
	class HTIterator
	{
   
	private:
		typedef HashNode<T> Node;					  // 哈希表节点
		typedef HashTable<K, T, KeyOfT, hashF> HT;	  // 哈希表
		typedef HTIterator<K, T, KeyOfT, hashF> Self; // 迭代器本身
	public:
		HTIterator(Node* _node, HT* _ht)
			: node(_node)
			, ht(_ht)
		{
   }

		HTIterator(const HTIterator& hti)
			: node(hti.node)
			, ht(hti.ht)
		{
   }

		Self& operator++()
		{
   
			// 如果传过来的节点指针不为空，则直接跳到下一个节点
			if (node->_next != nullptr)
			{
   
				node = node->_next;
			}
			// 当前节点为空，找下一个桶
			else
			{
   
				KeyOfT kot;
				hashF hf;

				// 计算这个节点映射到桶的位置
				size_t hashi = hf(kot(node->_data));
				hashi %= ht->_tables.size();
				
				++hashi; // 当前桶已经遍历完，需要对hashi进行自增

				// 遍历判断其他哈希桶是否为空，不为空则返回这个桶的指针
				for (; hashi < ht->_tables.size(); ++hashi)
				{
   
					if (ht->_tables[hashi] != nullptr)
					{
   
						node = ht->_tables[hashi];
						break;
					}
				}
				// 映射位置等于有效数据时，说明已经越界（走到尾的情况）
				if (hashi == ht->_tables.size())
				{
   
					node = nullptr;
				}
			}
			return *this;
		}
		
		// 后置++，先使用后自增
		Self operator++(int)
		{
   
			Self tmp(this);
			++(*this);
			return tmp;
		}

		T& operator*()
		{
   
			return node->_data;
		}

		T* operator->()
		{
   
			return &(node->_data);
		}

		bool operator!=(const HTIterator& hti) const
		{
   
			return node != hti.node;
		}

		bool operator==(const HTIterator& hti) const
		{
   
			return node == hti.node;
		}
	public:
		Node* node; // 哈希节点指针
		HT* ht;		// 哈希表指针（this）
	};
}

哈希桶迭代器自增图解：
在这里插入图片描述

增加通过key获取value操作

哈希桶节点的模板类型T是不确定的，是unordered_map的时候是键对值(pair<K, V>)，而unordered_set只是一个关键码(Key)
所以我们需要建立一个仿函数将它们进行区分（开头有讲到）

unordered_map：

namespace Myself
{
   
	template <typename K, typename V, typename hashF = BUCKetHash::HashDF<K>>
	class unordered_map
	{
   
	private:
		struct MapKeyOfT
		{
   
			const K& operator()(const pair<K, V>& kv)
			{
   
				return kv.first;
			}
	private:
		BUCKetHash::HashTable<K, pair<K, V>, MapKeyOfT, hashF> ht;
	}; 
}

unordered_set：

namespace Myself
{
   
	template <typename K, typename hashF = BUCKetHash::HashDF<K>>
	class unordered_set
	{
   
	private:
		struct SetKeyOfT
		{
   
			const K& operator()(const K& key)
			{
   
				return key;
			}
	private:
		BUCKetHash::HashTable<K, K, SetKeyOfT, hashF> ht;
	};
}

增加通过哈希函数转换无符号整形操作

对关键码进行转换：

因为哈希桶需要对该关键码映射对应的位置，所有需要把该关键码统一修改

namespace BUCKetHash
{
   
	// 仿函数：处理特殊的Key值问题 -- 后面需要对数据进行无符号整形转换
	template <typename K>
	struct HashDF
	{
   
		size_t operator()(const K& key)
		{
   
			return static_cast<size_t>(key);
		}
	};

	template <>
	struct HashDF<string>
	{
   
		size_t operator()(const string& str)
		{
   
			size_t HDS = 0;
			for (auto& e : str)
			{
   
				HDS = HDS * 131 +