关联式容器包括:
unordered
_
set
、
unordered
_
multiset
、
unordered
_
map
、 unordered_
multimap
四种。它们的底层使用的数据结构都是哈希表。要学习它们的使 用,也可以从:初始化、遍历、查找、插入、删除、针对自定义类型等方面进行学 习。但是首先需要学习关于哈希表的几个概念:哈希函数、哈希冲突、解决哈希冲突的方法、装载因子(
装填因子、负载因子
)
哈希相关概念
哈希函数
是一种根据关键码
key
去寻找值的数据映射的结构,即:根据
key
值找到
key
对应的存储位置。
size_t index = H(key)//由关键字获取所在位置
哈希函数的构造
- 定址法: H(key) = a * key + b;
- 平方取中法: key^2 = 1234^2 = 1522756 ------>227;
- 数字分析法:H(key) = key % 10000;
- 除留取余法:H(key) = key mod p (p <= m, m为表长);
哈希冲突
就是对于不一样的
key
值,可能得到相同的地址
,
即
:
H
(
key
1) =
H
(
key
2)
哈希冲突的解决办法
- 开放定址法;
- 链地址法 (推荐使用这种,这也是STL中使用的方法);
- 再散列法;
- 建立公共溢;
装载因子
装载因子
a
= (
实际装载数据的长度
n
)/(
表长
m
)
; a越大,哈希表填满时所容纳的元素越多,空闲位置越少,好处是提高了空间利用率,但是增加了哈希碰撞的风险,降低了哈希表的性能,所以平均查找长度也就越长;但是a
越小,虽然冲突发生的概率急剧下降,但是因为很多都没有存数据,空间的浪费比较大,经过测试,装载因子的大小在[0.5~0.75]
之间比较合理,特别是
0.75
。
哈希表的设计思想
用空间换时间,注意数组本身就是一个完美的哈希,所有元素都有存储位置,没有冲突,空间利用率也达到极致。
头文件与模板形式
#include <unordered_set>
template < class Key,
class Hash = std::hash<Key>,
class KeyEqual = std::equal_to<Key>,
class Allocator = std::allocator<Key>
> class unordered_set;
template < class Key,
class Hash = std::hash<Key>,
class KeyEqual = std::equal_to<Key>,
class Allocator = std::allocator<Key>
> class unordered_multiset;
//unordered_map与unordered_multimap位于#include <unordered_map>中
template< class Key,
class T,
class Hash = std::hash<Key>,
class KeyEqual = std::equal_to<Key>,
class Allocator = std::allocator< std::pair<const Key, T>>
> class unordered_map;
template< class Key,
class T,
class Hash = std::hash<Key>,
class KeyEqual = std::equal_to<Key>,
class Allocator = std::allocator< std::pair<const Key, T>>
> class unordered_multimap;
针对内置类型,初始化、遍历、查找、插入、删除、修改、下标访问这些与关联式容器类似,无序关联式容器中元素没有顺序,底层采用的是
哈希表
。
针对于自定义类型的操作(非常重要)
对于无序关联式容器而言,它们的模板参数中存在两个模板参数
Hash
与
KeyEqual
,它们针对的都是Key
类型,而如果
Key
是自定义类型,我们就需要重新改写
Hash
与KeyEqual。
针对于模板参数
Hash
而言,改写的方式有两种:特化默认的参数
std
::
hash
或者自己实现一个行为类似std
::
hash
的类,我们称之为函数对象。
namespace std
{
template <>
class hash<类名>
{
public:
size_t operator()(const 类名 &rhs) const//注意返回类型确定了就是std::size_t
{
//自己在此处实现hash函数
}
};//end of std::hash
}//end of namespace std
struct HashPoint
{
size_t operator()(const 类名 &rhs) const//注意返回类型确定了就是std::size_t
{
//自己在此处实现hash函数
}
};//end of struct HashPoint
针对于模板参数
KeyEqual
而言,改写的方式有三种:特化默认的参数
std
::
equal
_
to
、函数对象的形式、运算符重载。
//1、模板的特化
namespace std
{
template <>//模板的特化
struct equal_to<类名> //特化类型的类名
{
bool operator()(const 类名 &lhs, const 类名 &rhs) const //不要忘记这个const
{
//比较lhs与rhs是不是相等,相等就返回true,否则就是false
//...
}
};
}//end of namespace std
//2、函数对象的形式
struct EqualToPoint
{
bool operator()(const T &lhs, const T &rhs) const
{
//比较lhs与rhs是不是相等,相等就返回true,否则就是false
//...
}
};
//3、运算符重载形式
bool operator==(const 类名 &lhs, const 类名 &rhs)
{
//比较lhs与rhs是不是相等,相等就返回true,否则就是false
//...
}