使用迭代器而非下标实现对vector元素逐个的访问更具有逻辑上的完整性,随着对C++理解的加深,应该越来越习惯使用迭代器,在一次使用中犯了如下的错误:
vector nums = { 1,2,3,4,5,6,7,8,9,0 };
vector::iterator itor1 = nums.begin();
vector::iterator itor2 = itor1 + 1;
while (nums.size() > 1)
{
if (itor1 == nums.end()-1 || itor2 == nums.end() - 1) return nums[0]; (1)
if (*itor1 != *itor2)
{
itor2 = nums.erase(itor2);
if (itor2 == itor1 + 1) ++itor2;
itor1 = nums.erase(itor1);
}
}
return nums[0];
在上述代码中,while()循环只能执行一次,在进入第二次循环时总会卡在标号(1)的地方,编译器不会报错,只是直接在这里终止程序,经过一番探索发现,如果一开始定义了一个vector的迭代器,而后又对该vector的长度进行了改变(例如push_back()或者这里的erase()操作),那么之前定义的迭代器将面临失效,不能再信赖。
这里的改变是指一经改变的意思,即使对它先后进行了一次erase()和push_back(),虽然从结果看,vector的长度没有改变,但变化的事实已经发生了,迭代器同样会失效。
迭代器失效的原因:
vector是一段连续存储的存储空间,如果对vector使用了push_back()命令,意味着将原来的空间舍弃并开辟出一片新的空间,可以使用如下代码检验:
vector num={1,1,1,1};
cout <<&num[0]<<endl;
num.push_back(0);
cout<<&num[0];
两次会输出不同的结果。这里要注意的是:
&num与&num[0] 不相等,
应该是因为num实际上是一个vector类型的对象,当你声明时已经为其分配了地址,之后不会改变,而&num[0]是为这个对象中的数据成员分配的地址。
因此,对vector进行push_back()操作会改变vector全体成员的地址,迭代器因此失效。
补充一点:针对vector的内存重新分配问题,如果想避免的话,可以使用reserve预先分配出足够的内存。
一般情况下,由于使用erase()只会定点删除指定部位的元素,不会导致vector全体元素地址的重新分配,只会影响删除点之后内存和迭代器,因此可能不会产生所有迭代器失效的可能。但这并不绝对,会不会有影响似乎还取决于编译器。