STL容器迭代器失效问题

众所周知当使用一个容器的insert或者erase函数通过迭代器插入或删除元素"可能"会导致迭代器失效,因此很多建议都是让我们获取insert或者erase返回的迭代器,以便用重新获取新的有效的迭代器进行正确的操作:

view plaincopy to clipboardprint?
iter=vec.insert(iter);  
iter=vec.erase(iter);     
  想想究竟为什么迭代器失效,原因也不难理解。以vector为例,当我们插入一个元素时它的预分配空间不够时,它会重新申请一段新空间,将原空间上的元素复制到新的空间上去,然后再把新加入的元素放到新空间的尾部,以满足vector元素要求连续存储的目的。而后原空间会被系统撤销或征做他用,于是指向原空间的迭代器就成了类似于“悬垂指针”一样的东西,指向了一片非法区域。如果使用了这样的迭代器会导致严重的运行时错误就变得很自然了。这也是许多书上叙述vector在insert操作后“可能导致所有迭代器实效”的原因。但是想到这里我不禁想到vector的erase操作的叙述是“会导致指向删除元素和删除元素之后的迭代器失效”。但是明显感觉erase带来失效要比insert来得轻得多。似乎“此失效非彼失效”,想想似乎也是这样的:erase操作是在原空间上进行的,假设有一个存有"12345"序列的vector<int>容器原本指向3的迭代器在我删除2之后无非变成指向4了,我只要注意别用到超过end位置的迭代器不就行了吗?

  说了这么多似乎可以归纳一下迭代器失效的类型了:

  1.由于容器元素整体“迁移”导致存放原容器元素的空间不再有效,从而使得指向原空间的迭代器失效。

  2.由于删除元素使得某些元素次序发生变化使得原本指向某元素的迭代器不再指向希望指向的元素。

  对于第一种类型没什么好就是的了,原因应该确定如此了。可对于第二种,我写了如下的代码

view plaincopy to clipboardprint?
vector<int> vec;  
for(int i=0;i<10;i++)  
vec.push_back(i);  

vector<int>::iterator iter =vec.begin()+2;  
vec.erase(iter);//注:这里真的不建议这么写  
cout<<*iter<<endl;  
for(vector<int>::iterator it=vec.begin();it!=vec.end();it++)  
cout<<*it<<endl;

   按照我的猜测尽管我在注释的位置的写法很“危险”,但是我并未涉及到上面总结第一种失效类型的范畴。程序应该还是会如预期的一样删除在vec[2]位置上的2然后输出前移到vec[2]位置上的3,并输出0到10不含2的所有数字,于是vs2008的c++环境下运行一下,竟然一个是个无情的“红叉”。按道理说这种写法是绝对不对出现严重的运行时错误的,难道是猜测得不对吗?

   当时被这样的疑问困扰了几天,有一天突然想起一个关于容器迭代器作参数的例子,在vs2008下运行不了,但是在vc6.0下却可以,有人说是因为08采用了更为严格的类型检测机制。于是将上面的代码放到6.0里,果然得到了预期的效果,看来系统果然是这么处理的。至于08为什么不可以,现在我只能认为是采用了更加安全的检查机制。使得第二种类型的失效后果同样“不可饶恕”。

  这样我就又想到假如insert元素时原空间够用的话,是不是也不会产生第一类失效而产生第二类失效呢?

view plaincopy to clipboardprint?
vector<int> vec;  
for(int i=0;i<10;i++)  
    vec.push_back(i);  
       cout<<"capacity:"<<vec.capacity()<<endl;//查看预分配空间大小  
vector<int>::iterator iter =vec.begin()+2;  
vec.insert(iter,100);  
cout<<"capacity:"<<vec.capacity()<<endl;    
cout<<*iter<<endl;  
for(vector<int>::iterator it=vec.begin();it!=vec.end();it++)  
cout<<*it<<endl; 
  
  同样在vc6.0下,证明了假设是对的。但是上面的种种做法只是为了帮助我理解迭代器实效的原因,建议使用insert和erase操作时还是像许多书中介绍的如第一段代码那样的写法,这是一种好的且安全的习惯。总之一句话去相信“insert和erase操作后所有的迭代器都会失效”。


迭代器(iterator)是一个可以对其执行类似指针的操作(如:解除引用(operator*())和递增(operator++()))的对象,我们可以将它理解成为一个指针。但它又不是我们所谓普通的指针,我们可以称之为广义指针,你可以通过sizeof(vector::iterator)来查看,所占内存并不是4个字节。

    首先对于vector而言,添加和删除操作可能使容器的部分或者全部迭代器失效。那为什么迭代器会失效呢?vector元素在内存中是顺序存储,试想:如果当前容器中已经存在了10个元素,现在又要添加一个元素到容器中,但是内存中紧跟在这10个元素后面没有一个空闲空间,而vector的元素必须顺序存储一边索引访问,所以我们不能在内存中随便找个地方存储这个元素。于是vector必须重新分配存储空间,用来存放原来的元素以及新添加的元素:存放在旧存储空间的元素被复制到新的存储空间里,接着插入新的元素,最后撤销旧的存储空间。这种情况发生,一定会导致vector容器的所有迭代器都失效。

我们看到实现上述所说的分配和撤销内存空间的方式以实现vector的自增长性,效率是极其低下的。为了使vector容器实现快速的内存分配,实际分配的容器会比当前所需的空间多一些,vector容器预留了这些额外的存储区,用来存放新添加的元素,而不需要每次都重新分配新的存储空间。你可以从vector里实现capacity和reserve成员可以看出这种机制。

    capacity和size的区别:size是容器当前拥有的元素个数,而capacity则指容器在必须分配新存储空间之前可以存储的元素总数。

    vector迭代器的几种失效的情况: 1.当插入(push_back)一个元素后,end操作返回的迭代器肯定失效。 2.当插入(push_back)一个元素后,capacity返回值与没有插入元素之前相比有改变,则需要重新加载整个容器,此时first和end操作返回的迭代器都会失效。 3.当进行删除操作(erase,pop_back)后,指向删除点的迭代器全部失效;指向删除点后面的元素的迭代器也将全部失效。

    deque迭代器的失效情况: 在C++Primer一书中是这样限定的: 1.在deque容器首部或者尾部插入元素不会使得任何迭代器失效。 2.在其首部或尾部删除元素则只会使指向被删除元素的迭代器失效。 3.在deque容器的任何其他位置的插入和删除操作将使指向该容器元素的所有迭代器失效。但是:我在vs2005测试发现第一条都不满足,不知为何?等以后深入STL以后慢慢的领会吧!

    只有list的迭代器好像很少情况下会失效。也许就只是在删除的时候,指向被删除节点的迭代器会失效吧,其他的还没有发现。

 

### C++ STL迭代器失效的原因 在 C++ 的标准模板库(STL)中,迭代器是一种通用工具,用于访问容器中的元素。然而,在某些情况下,当对容器进行修改操作时,可能会导致迭代器失效。这种现象的根本原因在于容器内部存储机制的变化。 #### 原因分析 1. **动态内存分配** 对于像 `std::vector` 和 `std::string` 这样的连续存储容器,每当其容量不足而需要扩展时,会触发重新分配内存的操作。此时,旧的内存会被释放,新的内存被分配,所有指向原有内存地址的迭代器都会因此失效[^1]。 2. **删除或插入操作** 当从容器中删除或插入元素时,可能会影响其他元素的位置。例如: - 在 `std::vector` 或 `std::deque` 中删除某个元素后,后续元素向前移动,这使得原本指向这些元素的迭代器不再有效。 - 插入新元素也可能引发类似问题,尤其是对于连续存储的容器,因为它们可能需要调整大小以容纳新增加的内容[^2]。 3. **关联容器的行为差异** 关联容器如 `std::set`, `std::map`, `std::unordered_set`, 和 `std::unordered_map` 使用的是基于节点的数据结构而非连续数组。在这种设计下,只有特定类型的迭代器会在特殊条件下失效。比如,在 `std::map` 上调用成员函数 `erase(iterator)` 不会使任何现有迭代器失效;但如果通过范围形式清除整个子集,则仅该范围内涉及的那些迭代器受到影响[^3]。 --- ### 解决方案 针对不同情况下的迭代器失效问题,可以采取相应的措施: #### 方法一:更新迭代器返回值 许多容器提供了一种安全的方式来处理这种情况——即让修改操作返回一个新的有效迭代器。例如,在执行删除操作时,可以通过如下方式进行修正: ```cpp for(auto it = nums.begin(); it != nums.end(); ){ if(*it < threshold){ it = nums.erase(it); } else{ ++it; } } ``` 这里每次成功删除一个满足条件的元素后,立即获取并使用由 `nums.erase()` 返回的新迭代器位置[^1]^。 #### 方法二:采用局部作用域内的临时变量保存状态 另一种常见做法是在循环体内创建额外控制逻辑来跟踪当前进度以及潜在变化的影响。考虑下面的例子展示如何向量前部添加项目而不破坏外部指针链路: ```cpp auto it = vec.begin(); for(; it != vec.end(); ++it){ if(*it % 2 ==0 ){ it=vec.insert(it,*it-1); ++it;//跳过刚加入的那个项避免重复计算 } } ``` #### 方法三:利用更高层次抽象算法代替手动管理 现代C++提供了丰富的算法支持,能够减少直接操控原始迭代器的机会从而降低风险。例如替换显式的遍历代码块为更简洁的形式: ```cpp #include<algorithm> //... remove_if(nums.begin(), nums.end(), [](const int& value){return value<threshold;} ); nums.shrink_to_fit();//清理多余空间可选步骤 ``` 这种方法不仅提高了程序可读性和维护便利度,还自动规避了一些常见的陷阱[^4]^. --- ### 示例代码综合应用 以下是结合上述理论的一个完整实例演示正确处理各种场景的方法: ```cpp #include <iostream> #include <vector> using namespace std; int main(){ vector<int> data={5,2,-9,8}; // 删除负数的同时保持迭代器有效性 for(auto iter=data.begin();iter!=data.end();){ if(*iter<0){ iter=data.erase(iter); }else{ ++iter; } } // 输出剩余正整数列表 cout<<"Positive numbers:"<<endl; for(const auto &num:data){ cout<<num<<"\t"; } cout<<endl; return EXIT_SUCCESS; } ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值