C++ STL 迭代器失效问题

之前看《C++ Primier》的时候,也解到在顺序型窗口里insert/erase会涉及到迭代器失效的问题,并没有深究。今天写程序的时候遇到了这个问题。
1 莫名其妙的Erase  

  最初我的程序是酱紫的,别说话,我知道这样是有问题的,可这样是最直观的想法

   int arr[]={0,1,2,3,4,5,6,7,8,9,10}; 
  vector<int> a(arr,arr+sizeof(arr)/sizeof(*arr));for (auto it = a.begin(); it != a.end();++it ){ if ((*it)&1){ a.erase(it); } }

  没错,程序崩溃!删除了迭代器it之后,it迭代器失效了,无法再进行++it操作了。

  可是,当我觉得erase做的只是把it之后的元素向前移动一个位置而已,为什么迭代器失效了呢?我翻开《STL源码剖析》,SGI STL的vector<T,Alloc>::erase的源码是这样的:

iterator vector<T, Alloc>::erase(iterator position)
    {
        if (position + 1 != end())
            copy(position + 1, finish, position);
        --finish;
        destroy(finish);
        return position;
    }

  正如我所想,erase函数并没有对输入的position迭代器进行改写!我打印出调试信息,发现erase之后,迭代器的_Ptr成员,也就是指针的值并没有发生变化,而此指针所指的元素的确是下一个元素。那么为什么失效了呢?

  我又查了《C++ Primier》,发现此书上的标准写法是这样的:

int arr[]={0,1,2,3,4,5,6,7,8,9,10}; 
  vector<int> a(arr,arr+sizeof(arr)/sizeof(*arr));
    for (auto it = a.begin(); it != a.end();){
        if ((*it)&1){
            it=a.erase(it);
        }
        else
            ++it;    
    }  

  运行了一下,这样是没错的。我打印了调试信息,发现与之前一样,erase之后把结果赋给it,it里的成员_Ptr并没有发生变化。唯一的可能就是迭代器里还有别的标志,如果当前元素被删除之后,该迭代器也就“失效”了。《C++ Primier》并未对此作出过多解释,只是说,erase函数返回被删除元素的下一个元素的迭代器。

  结论:在STL里,我们不能以指针来看待迭代器,指针是与内存绑定的,而迭代器是与容器里的元素绑定的,删除了之后,该迭代器就失效了,在对其重新赋值之前,不能再访问此迭代器。

2 更加小心冀冀地Insert

  机智如我,自然会去探索一下insert之后,迭代器会怎样。于是:  

    vector<int> a;
    for (int i = 0; i < 10; ++i)
    {
        a.push_back(i);
    }

    for (auto it = a.begin(); it != a.end(); ++it){
        if (*it == 5){ 
            a.insert(it, 100);
       ++it; } }

  你猜怎么着??

  啥事儿没有!你可能会问,插入之后为什么要++it。插入之前,it指向5,在5之前插入100后,it指向100。这样下一次循环,it依然会指向5。相信我,你的程序会爆炸的!

  我作了个++it之后,it又指向5,下一次循环就直接指向5之后的元素了,顺利完成插入工作。

  世界和平~世界和平~我还真不确定。

  突然想到,当插入元素过多,vector的capacity会增加,这时会不会问题呢?说干就干:  

    vector<int> a;
    for (int i = 0; i < 13; ++i)
    {
        a.push_back(i);
    }

    for (auto it = a.begin(); it != a.end(); ++it){
        if (*it == 5){ 
            a.insert(it, 100);
       ++it;
        }
    }  

  BOOM!果然崩溃了!也就是说插入之后的迭代器失效了。那之前的呢?

  我决定粗暴地测试一下:

    vector<int> a;
    for (int i = 0; i < 13; ++i)
    {
        a.push_back(i);
    }
    auto it1=a.begin();
    for (auto it = it1; it != a.end(); ++it){
        if (*it == 5){ 
            a.insert(it, 100);
        it=it1;
        }
    }  

  我插入之后,直接让it指向begin(),然后单步调试。执行完it=it1还好好的,可再去执行++it还是崩溃了。

  也就是说,capacity变化之后,所有的迭代器都失效了!这是当然了呀!capacity发生变化,容器内部做的不仅仅是增加capacity这么简单,因为容器所在内存后面可能没有足够的内存让我们使用,所以,容器要重新开辟一段足够大的内存来存储容器里的元素,当前内存会被释放。这样一来,迭代器自然失效了。

3 C++ Primier的总结

  关于容器的迭代器失效的问题,C++ Primier用了一小节作了总结,我翻译成中文如下:

  (1)增加元素到容器后

  对于vector和string,如果容器内存被重新分配,iterators,pointers,references失效;如果没有重新分配,那么插入点之前的iterator有效,插入点之后的iterator失效;

  对于deque,如果插入点位于除front和back的其它位置,iterators,pointers,references失效;当我们插入元素到front和back时,deque的迭代器失效,但reference和pointers有效;

  对于list和forward_list,所有的iterator,pointer和refercnce有效。

  (2)从容器中移除元素后

  对于vector和string,插入点之前的iterators,pointers,references有效;off-the-end迭代器总是失效的;

  对于deque,如果插入点位于除front和back的其它位置,iterators,pointers,references失效;当我们插入元素到front和back时,off-the-end失效,其他的iterators,pointers,references有效;

  对于list和forward_list,所有的iterator,pointer和refercnce有效。

  (3)在循环中refresh迭代器

  当处理vector,string,deque时,当在一个循环中可能增加或移除元素时,要考虑到迭代器可能会失效的问题。我们一定要refresh迭代器。

int arr[] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
    deque<int> v(arr,arr+sizeof(arr)/sizeof(*arr));
    for (auto it = v.begin(); it != v.end(); )
    {
        if ((*it) & 1)
        {
            it = v.insert(it, *it);
            it += 2;
        }
        else
            it = v.erase(it);
    }

  至于it+=2,很容易解释,insert之后,it指向新增加的元素,+2之后,it指向下一个要处理的元素。

  (4)在循环不变式中不要store off-the-end迭代器

  这个很容易理解了,增加或移除元素之后,off-the-end失效了,不store的话,每次从end()函数中取的都是最新的off-the-end,自然不会失效。

  最后:《C++ Primier》是本好书

  

  

### C++ STL迭代器失效的原因 在 C++ 的标准模板库(STL)中,迭代器是一种通用工具,用于访问容器中的元素。然而,在某些情况下,当对容器进行修改操作时,可能会导致迭代器失效。这种现象的根本原因在于容器内部存储机制的变化。 #### 原因分析 1. **动态内存分配** 对于像 `std::vector` 和 `std::string` 这样的连续存储容器,每当其容量不足而需要扩展时,会触发重新分配内存的操作。此时,旧的内存会被释放,新的内存被分配,所有指向原有内存地址的迭代器都会因此失效[^1]。 2. **删除或插入操作** 当从容器中删除或插入元素时,可能会影响其他元素的位置。例如: - 在 `std::vector` 或 `std::deque` 中删除某个元素后,后续元素向前移动,这使得原本指向这些元素的迭代器不再有效。 - 插入新元素也可能引发类似问题,尤其是对于连续存储的容器,因为它们可能需要调整大小以容纳新增加的内容[^2]。 3. **关联容器的行为差异** 关联容器如 `std::set`, `std::map`, `std::unordered_set`, 和 `std::unordered_map` 使用的是基于节点的数据结构而非连续数组。在这种设计下,只有特定类型的迭代器会在特殊条件下失效。比如,在 `std::map` 上调用成员函数 `erase(iterator)` 不会使任何现有迭代器失效;但如果通过范围形式清除整个子集,则仅该范围内涉及的那些迭代器受到影响[^3]。 --- ### 解决方案 针对不同情况下的迭代器失效问题,可以采取相应的措施: #### 方法一:更新迭代器返回值 许多容器提供了一种安全的方式来处理这种情况——即让修改操作返回一个新的有效迭代器。例如,在执行删除操作时,可以通过如下方式进行修正: ```cpp for(auto it = nums.begin(); it != nums.end(); ){ if(*it < threshold){ it = nums.erase(it); } else{ ++it; } } ``` 这里每次成功删除一个满足条件的元素后,立即获取并使用由 `nums.erase()` 返回的新迭代器位置[^1]^。 #### 方法二:采用局部作用域内的临时变量保存状态 另一种常见做法是在循环体内创建额外控制逻辑来跟踪当前进度以及潜在变化的影响。考虑下面的例子展示如何向量前部添加项目而不破坏外部指针链路: ```cpp auto it = vec.begin(); for(; it != vec.end(); ++it){ if(*it % 2 ==0 ){ it=vec.insert(it,*it-1); ++it;//跳过刚加入的那个项避免重复计算 } } ``` #### 方法三:利用更高层次抽象算法代替手动管理 现代C++提供了丰富的算法支持,能够减少直接操控原始迭代器的机会从而降低风险。例如替换显式的遍历代码块为更简洁的形式: ```cpp #include<algorithm> //... remove_if(nums.begin(), nums.end(), [](const int& value){return value<threshold;} ); nums.shrink_to_fit();//清理多余空间可选步骤 ``` 这种方法不仅提高了程序可读性和维护便利度,还自动规避了一些常见的陷阱[^4]^. --- ### 示例代码综合应用 以下是结合上述理论的一个完整实例演示正确处理各种场景的方法: ```cpp #include <iostream> #include <vector> using namespace std; int main(){ vector<int> data={5,2,-9,8}; // 删除负数的同时保持迭代器有效性 for(auto iter=data.begin();iter!=data.end();){ if(*iter<0){ iter=data.erase(iter); }else{ ++iter; } } // 输出剩余正整数列表 cout<<"Positive numbers:"<<endl; for(const auto &num:data){ cout<<num<<"\t"; } cout<<endl; return EXIT_SUCCESS; } ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值