几种常见 容器 比较和分析 hashmap, map, vector, list ...hash table

STL容器性能对比
本文对比了STL容器如list、vector、map及hash_map的性能特点,详细分析了不同场景下各种容器的优势与局限性。

转自:http://www.haogongju.net/art/1543058

 

list支持快速的插入和删除,但是查找费时;

vector支持快速的查找,但是插入费时。

map查找的时间复杂度是对数的,这几乎是最快的,hash也是对数的。 
如果我自己写,我也会用二叉检索树,它在大部分情况下可以保证对数复杂度,最坏情况是常数复杂度,而std::map在任何情况下都可以保证对数复杂度,原因是它保证存诸结构是完全二叉检索树,但这会在存诸上牺牲一些时间。

STL   中的   map   内部是平衡二叉树,所以平衡二叉树的性质都具备。查找数据的时间也是对数时间。 vector,在分配内存上一般要比   new   高效的多。

为什么说   hash_map   是对数级的?在不碰撞的情况下,hash_map是所有数据结构中查找最快的,它是常数级的。 
如果对问题设计了足够好的hash算法,保证碰撞率很低,hash_map的查找效率无可置疑。 
另外,STL的map,它的查找是对数级的,是除hash_map外最高的了,你可以说“也许还有改进余地”,但对于99.9999%的程序员,设计一个比STL   map好的map,我执悲观态度。 
STL的map有平衡策略(比如红黑树什么的),所以不会退化,不需要考虑数据本身的分布问题。只不过,如果数据本身是排好序的,用vector或heap会明显的快些,因为它们的访问比较简单。

我想没必要怀疑stl::map的查找效率,影响效率最主要的因素是什么?算法,在查找问题上,有什么算法比RB_tree更好吗?至少现在还没有。不否 认你可以通过自己写代码,设计一个符合你需要的BR—TREE,比stl::map简捷那么一点,但最多也就每次迭代中少一行指令而已,处理十万个数据多 执行十万行指令,这对你重要吗?如果你不是在设计OS像LINUX,没人会关注这十万行指令花的时间。 
rb-tree的时间花在了插入和删除上,如果你不是对插入和删除效率要求很高,你没有理由不选择基于rb-tree的stl::map。

大多数程序员写不出比std::map更好的map,这是当然的。然而并不是std::map的所有特性都出现在我们的程序中,自己编写的可以更适合自己的程序,的确会比std::map更快一些。

关于hash_map,它与map的实现机制是不一样的,map内部一般用树来实现,其查找操作是O(logN)的,这个没有争议,我就不多说了。
hash_map的查找,内部是通过一个从key到value的运算函数来实现的,这个函数“只接受key作为参数”,也就是说,hash_map的查找 算法与数据量无关,所以认为它是O(1)级的。来这里的应该都是达人,可以参看《数据结构》。当然,事实总不这样完美,再引一段前面我自已说的话,进一步 说明,以免误会:

----------------------------------------- 
在不碰撞的情况下,hash_map是所有数据结构中查找最快的,它是常数级的。 
------------------------------------------ 
注意我的前提:“在不碰撞的情况下”,其实换句话说,就是要有足够好的hash函数,它要能使key到value的映射足够均匀,否则,在最坏的情况下,它的计算量就退化到O(N)级,变成和链表一样。 
如果说   hash_map   是所有容器中最慢的,也只能说:“最拙劣的hash函数”会使hash_map成为查找最慢的容器。但这样说意义不大,因为,最凑巧的排列能使冒泡排序成为最快的排序算法。

BS: "对于大型容器而言,hash_map能够提供比map快5至10倍的元素查找速度是很常见的,尤其是在查找速度特别重要的地方.另一方面,如果hash_map选择了病态的散列函数,他也可能比map慢得多. "

ANSIC++在1998年之后就没再有重大改变,并且决定不再向C++标准库中做任何重大的变更,正是这个原因,hash   table(包括hash_map)并没有被列入标准之中,虽然它理应在C++标准之中占有一席之地。 
虽然,现在的大多数编译平台支持hash   table,但从可移植性方面考虑,还是不用hash   table的好。

hehe俺也来凑凑热闹。 
1.有的时候vector可以替代map 
比如key是整数,就可以以key的跨度作为长度来定义vector。 
数据规模很大的时候,差异是惊人的。当然,空间浪费往往也惊人。 
2.hash是很难的东西 
没有高效低碰撞的算法,hash_xxx没有意义。 
而对不同的类型,数据集,不可能有优良的神仙算法。必须因场合而宜。 
俺有的解决方法是GP,可不是饭型,是遗传编程,收效不错。

你的百万级的数据放到vector不大合适。因为vector需要连续的内存空间,显然在初始化这个容器的时候会花费很大的容量。 
使用map,你想好了要为其建立一个主键吗?如果没有这样的需求,为什么不考虑deque或者list? 
map默认使用的是deque作为容器。其实map不是容器,拿它与容器比较意义不大。因为你可以配置它的底层容器类型。

如果内存不是考虑的问题。用vector比map好。map每插入一个数据,都要排序一次。所以速度反不及先安插所有元素,再进行排序。

用 binary_search对已序区间搜索,如果是随机存取iterator,则是对数复杂度。可见,在不考虑内存问题的情况下,vector比map 好。

如果你需要在数据中间进行插入,list 是最好的选择,vector   的插入效率会让你痛苦得想死。

涉及到查找的话用map比较好,因为map的内部数据结构用rb-tree实现,而用vector你只能用线性查找,效率很低。

stl还提供了 hash容器,理论上查找是飞快~~~。做有序插入的话vector是噩梦,map则保证肯定是按key排序的,list要自己做些事情。

HASH类型的查找肯定快,是映射关系嘛,但是插入和删除却慢,要做移动操作, LIST类型的使链式关系,插入非常快,但是查找却费时,需要遍历~~ , 还是用LIST类型的吧,虽然查找慢点,

先快速排序,然后二分查找,效率也不低

### 下载 `hash_map` 相关的库或实现代码 对于希望获取 `hash_map` 实现代码的需求,有多种途径可以满足这一需求。 #### 使用 C++ 标准库中的 `unordered_map` 由于现代 C++ 推荐使用 `std::unordered_map` 而不是旧版本中的 `hash_map`[^3],可以从官方渠道获得最新的 C++ 编译器支持。安装最新版编译器通常会自带完整的标准模板库 (STL),其中包括 `unordered_map` 的实现: - 对于 Linux 用户来说,可以通过包管理工具如 apt-get 或 yum 安装 GCC; - Windows 用户可以选择 MinGW-w64 或者 Visual Studio 自带的支持; - macOS 上则可通过 Homebrew 安装 LLVM/Clang。 这些环境都包含了对 C++11 及以上版本的良好支持,因此可以直接访问并使用 `std::unordered_map`。 #### 获取第三方开源项目 如果确实需要特定功能或者更高效的哈希表实现,则可考虑一些知名的第三方库: - **Boost.Unordered**: Boost 库提供了非常强大的容器类集合,其中就包括了高效稳定的无序关联容器——`boost::unordered_map` 其他变体。通过官方网站下载整个 Boost 发行版即可得到该组件。 - **Google SparseHash**: Google 开发的一个轻量级且性能优秀的稀疏散列表达式,适用于内存敏感的应用场景。同样可以在其 GitHub 页面找到源码仓库链接进行克隆操作来获取所需文件。 - **folly/FBVectorMap**: Facebook 内部使用的高性能数据结构之一,在某些情况下可能提供更好的表现特性。Folly 是由 Facebook 维护的一组实用程序基础架构组件组成的集合;可以从对应的 Git 存储库中提取相关部分作为参考学习材料。 #### 查阅学术研究资料与教程文档 除了上述实际可用的产品外,网络上还有大量关于自定义构建哈希表的文章技术博客,比如基于拉链法(分离链接法)的手动编码实例[^4]。这类资源往往能帮助开发者深入了解底层原理,并根据具体应用场景调整优化策略。 ```cpp // 示例:简单的 hash_map 结构声明 template <typename KeyType, typename ValueType> struct HashPair { KeyType key; ValueType value; HashPair(KeyType k, ValueType v) : key(k), value(v) {} }; template <typename K, typename V> using HashMapList = std::list<HashPair<K,V>>; template <typename Tkey, typename Tval> class SimpleHashMap { private: using PairType = HashPair<Tkey,Tval>; using ListType = HashMapList<Tkey,Tval>; using TableType = std::vector<ListType>; public: // 构造函数初始化固定大小的桶数量 explicit SimpleHashMap(size_t bucket_count); void insert(const Tkey& key, const Tval& val); protected: size_t computeBucketIndex(const Tkey &key)const ; private: TableType table_; }; ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值