C++: unordered_map 花式插入key-value的5种方式

前言

无意中发现std::unordered_map、std::map等插入key-value对在C++17后竟有了 insert()operator[]emplace()try_emplace()insert_or_assign() 等超过5种方法,我们可以根据实际场景和对效率的要求,去选择不同的方法。在此不得不夸一夸C++的灵(fù)活(zá)性,不管怎么说,一点无用的知识又增加了。此外发现,Effective STL这本书中对insert()方法的介绍有些过时了。

下文中,使用一个测试类作为关联容器中的 mapped_type 来探究通过不同方法对map进行值插入的开销。

测试类定义

测试类 MyClass 定义如下, id 用于标识不同实例,定义了构造函数、拷贝构造函数、赋值运算符函数,构造函数设置 explicit 不允许隐式构造, 未定义移动构造函数和移动赋值函数。

class MyClass {
private:
    int id = 0;
public:
    MyClass() {
        std::cout << "Default Constructor called " << id << "\n";
    }
    explicit MyClass(int i):id(i) {
        std::cout << "Constructor called " << id << "\n";
    }

    MyClass(const MyClass& my_class) {
        id = my_class.id;
        std::cout<< "Copy Constructor called "<< id << "\n";
    }

    MyClass& operator=(const MyClass& my_class) {
        id = my_class.id;
        std::cout<< "Operator= called "<< id <<"\n";
        return *this;
    }
    
    ~MyClass() {
        std::cout<<"Destructor called "<<id<<"\n";
    }
};

初始化一个 unordered_map 和一些自定义类 MyClass的对象:

std::unordered_map<std::string, MyClass> myMap;
MyClass m1(1), m2(2),m3(3),m4(4),m5(5),m6(6),m7(7),m8(8),m9(9);

测试对比

将插入元素分为 add(key不存在)和 update (key已存在)两种情况进行讨论,基于 myMap 依次运行以下代码,对比相关函数调用开销。

1. add ,key不存在

依次按以下代码顺序执行插入 key-value对:

  • insert() :
myMap.insert({"one", m1});

创建临时的 key-value node 以及将其拷贝进 myMap 容器,二者都会调用MyClass的拷贝构造函数(本应移动MyClass,但未定义移动操作只能拷贝)。调用该方法后输出如下:

Copy Constructor called 1 // Make tmp std::pair
Copy Constructor called 1 // Copy pair to container
Destructor called 1       // tmp MyClass de
  • operator[] :
 myMap["two"] = m2;

该方法要求 mapped_type是可默认构造的, 当key不存在时,在myMap 中先分配了一个 {key, MyClass()} node的空间,该运算符返回该 MyClass() 的引用,再用 MyClass(2) 进行赋值,此过程调用默认构造函数和赋值运算符函数。调用该方法后输出如下:

Default Constructor called 0  // Call Default Constructor 
Operator= called 2            // Call Operator=()
  • emplace() :
myMap.emplace("three", m3);

直接传入key-value,在容器中原地构造 std::pair ,省去了相关函数调用开销。

Copy Constructor called 3      // Copy MyClass(3) to myMap

总结:当对效率要求较高,key不存在时,应优先使用 emplace() 插入key-value,避免临时变量带来的开销。

2.update,key存在

  • operator[] :

当Key存在时,value会被替换为新值,

 myMap["one"] = m4;

以上代码仅调用赋值运算符函数。

Operator= called 4
  • insert()emplace()

这两种方法,当Key存在时,value不会被替换为新值。但临时值会被创建出来。

myMap.insert(std::make_pair("one", m4));

insert() 而言,创建临时key-value node以及拷贝进容器的操作都会执行。

Copy Constructor called 5
Copy Constructor called 5
Destructor called 5
Destructor called 5

emplace() 而言,继续做以下插入操作,

myMap.emplace("three", m6);

“three”对应的value仍为 m3 ,但pair的临时变量仍然会被创建,之后便销毁:

Copy Constructor called 6
Destructor called 6
  • C++17 try_emplace() :

如果key已经存在,不会创建key-value node。否则,将会将其插入到map中,

myMap.try_emplace("three", m7);

以上代码输出结果如下,未创建pair。

Constructor called 7
Destructor called 7
  • C++17 insert_or_assign()

当key存在时,将对应value值进行更新插入key-value对,

myMap.insert_or_assign("three", m8);

运行以上代码后,”three”对应value为 m8 , 输出如下, 仅调用了赋值运算符函数,这与 operator[]是一样的。

Operator= called 8

当key不存在时,插入key-value对,

myMap.insert_or_assign("four", m9);

运行后输出如下,仅调用拷贝构造函数,可见,该方法也支持原地构造。与 operator[] 不同的是,该方法不需要 mapped_type 支持默认构造函数。

Copy Constructor called 9
  • operator[] vs insert_or_assign() :
要求Value可默认构造返回值
operator[]truevalue
insert_or_assign()falsepair<iterator, bool>

insert_or_assign() 的返回值为 std::pair<iterator, bool> ,其中 iterator 指向插入或更新的元素, bool 变量的含义为:如果发生插入,值为 true ;如果发生替换,值为 false

总之,当key存在时,如果需要替换value值,应使用operator[] ;需要更丰富的返回信息时,可考虑insert_or_assign() 。如果不需要替换value值,为避免临时node创建,可使用 try_emplace()

测试程序地址https://godbolt.org/z/M3KTPhvoY

总结

以上提到的5种方法之间的差异对比可参考下图

各方法对比如下:

C++版本是否覆盖value构造node前事先查找
insert()C++03falsefalse
operator[]C++03true\
emplace()C++11falsefalse
try_emplace()C++17falsetrue
insert_or_assign()C++17true\

最后总结,当对效率要求较高:

  • 当key不存在时,应优先使用 emplace() 插入key-value,避免创建临时变量带来的开销。

  • 当key存在时,如果需要替换value值,应使用operator[] ;如果需要更丰富的返回信息时,可考虑insert_or_assign()

  • 当key存在时,现代C++的 insert()方法已经不能更新值了,Effective STL书中的介绍已经过时。

  • 如果不需要替换value值,为避免临时node创建,可使用 try_emplace()

References

  1. https://en.cppreference.com/w/cpp/container/unordered_map
  2. https://www.fluentcpp.com/2018/12/11/overview-of-std-map-insertion-emplacement-methods-in-cpp17/
  3. https://en.cppreference.com/w/cpp/container/map/insert_or_assign

你好,我是七昂,致力于分享C++、计算机底层、机器学习等系列知识。希望我们能一起探索程序员修炼之道。如果我的创作内容对您有帮助,请点赞关注。如果有问题,欢迎随时与我交流。感谢你的阅读。

公众号、知乎:七昂的技术之旅

C++ 中,`boost::unordered_map` 和 `std::unordered_map` 都是哈希表的实现,用于存储键值对,并提供平均情况下常数时间复杂度的查找、插入和删除操作。尽管它们的功能相似,但在实现、依赖、可移植性和接口等方面存在一些关键区别。 ### 1. 来源与标准支持 `std::unordered_map` 是 C++11 标准引入的一部分,属于标准库容器,因此不需要额外安装依赖库即可使用。它具有良好的跨平台兼容性,并且被现代 C++ 编译器广泛支持[^3]。 `boost::unordered_map` 是 Boost 库的一部分,属于第三方库实现。使用时需要额外安装 Boost 并在项目中正确配置头文件路径。尽管 Boost 在 C++ 社区中被广泛使用,但在某些受限环境中可能不适用。 ### 2. 接口一致性 两者的接口设计非常相似,均支持基本的哈希表操作,如 `insert`、`find`、`erase` 等。然而,`boost::unordered_map` 在某些版本中可能提供额外的功能或更灵活的扩展接口,例如对自定义哈希策略的更细粒度控制,这在某些高级应用场景中可能更有优势[^3]。 ### 3. 性能与实现细节 `std::unordered_map` 的实现依赖于编译器和标准库(如 libstdc++ 或 libc++),其性能可能因平台而异。由于是标准库的一部分,通常经过高度优化,适合大多数应用场景。 `boost::unordered_map` 的实现独立于编译器,通常在接口和行为上更加一致。对于需要跨编译器兼容性的项目,Boost 实现可能提供更稳定的性能表现。 ### 4. 可移植性 由于 `std::unordered_map` 是 C++11 标准的一部分,因此在支持 C++11 的所有平台上都可以使用,具有更高的可移植性。 `boost::unordered_map` 虽然也需要 C++11 支持,但由于其依赖于 Boost 库,因此在部署时需要确保目标环境中 Boost 已正确安装和配置。 ### 5. 扩展性与功能 Boost 库通常提供比标准库更丰富的功能。例如,`boost::unordered_map` 可能支持额外的哈希策略、内存管理选项以及与其他 Boost 组件的集成(如 `boost::hash`)。这些特性在某些特定项目中可能非常有用。 相比之下,`std::unordered_map` 的功能较为基础,但在大多数情况下已经足够使用。 ### 示例代码对比 #### `std::unordered_map` 示例 ```cpp #include <iostream> #include <unordered_map> int main() { std::unordered_map<std::string, int> umap; // 插入元素 umap["apple"] = 10; umap["banana"] = 20; // 查找元素 if (umap.find("apple") != umap.end()) { std::cout << "Found apple: " << umap["apple"] << std::endl; } return 0; } ``` #### `boost::unordered_map` 示例 ```cpp #include <boost/unordered_map.hpp> #include <iostream> int main() { boost::unordered_map<std::string, int> umap; // 插入元素 umap["apple"] = 10; umap["banana"] = 20; // 查找元素 if (umap.find("apple") != umap.end()) { std::cout << "Found apple: " << umap["apple"] << std::endl; } return 0; } ``` ### 总结 - 如果项目需要标准库支持且不希望引入额外依赖,`std::unordered_map` 是更简洁、可移植的选择。 - 如果项目已经使用了 Boost 或需要更高级的功能和跨编译器一致性,`boost::unordered_map` 可能更适合。 在选择时,应根据项目的具体需求、目标平台的可用性和团队对 Boost 的熟悉程度进行权衡。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值