C++ vector中的迭代器失效问题
vector中的迭代器失效问题
在使用vector的成员函数时,有两个成员函数内部会出!](https://img-blog.****img.cn/20181124093029161.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L01famlhbmppYW5qaWFv,size_16,color_FFFFFF,t_70)现迭代器失效的问题。分别是insert和erase而这两个成员函数迭代器失效的原因并不相同。
insert
在我们使用insert的接口时,不会遇到迭代器的失效问题的影响,因为在insert中已经处理过l。而此处所说的就是在insert实现过程中出现的迭代器失效问题。
insert(iterator pos,value_type value);
vector类中的insert函数,在所传迭代器位置的数前面插入一个数,返回值是所插入位置的迭代器。
现在我们对于该函数进行模拟实现,插入时有两种情况
- 插入后长度不会超出当前容量
- 插入后超出当前容量
对于第一种,在容量足够的情况下插入,进行正常的元素挪动和插入就行了。
对于第二种,当插入后的长度超出了容量的范围。此时我们就需要先进行扩容。
如何扩容?
扩容时因为此时容量已不够用,我们需要重新开辟一块大于当前容量的空间。至于开辟多大的容量,这个我们可以自定义。只要能容纳所插入的值。在vs下每次扩容的大小是之前容量的1.5倍,而在linux g++下每次开辟的容量是之前容量的2倍。开辟新空间后,将原空间的内容拷贝至新空间即可,再将对象中的指针指向新空间,再释放原空间即可即可。此时应该注意,需要进行深拷贝,如果当vector中的元素为string vector时,如果进行是浅拷贝,在析构的时候会发生错误。
完成扩容后,此时却出现了一个问题,我们所传的迭代器位置是指向原空间的,而原空间的位置在我们进行扩容时已经释放了,那意味着原来的迭代器位置已经是一个野指针,此时原先的迭代器位置已将失效。
如何解决?
我们只需在扩容时,将原迭代器位置的偏移量记录下来,在新开辟的空间中找到原有的位置即可。
insert 的模拟实现
Iterator Insert(Iterator pos,T value)
{
assert(pos<=_finish);
size_t offset=pos-_start;//增容更换空间后pos处的迭代器会失效,记录其偏移量
if(_finish == _endofstorage)
{
size_t newCapacity = Capacity()==0?2:2*Capacity(); //防止第一次为空
Reserve(newCapacity);
}
pos = begin() + offset;
Iterator end =this->end();
while(end != pos)
{
*end = *(end-1);
end--;
}
*pos = value;
_finish++;
return pos;
}
erase
在vector中erase 也会导致迭代器失效,不同于insert是在内部实现时会遇到的空间的更换造成迭代器失效,不会对于我们使用时造成影响,但erase会在使用时对我们造成一些影响。
iterator erase(iterator pos);
返回所删除的数的下一个数的迭代器
int arr[] = { 1, 2, 3, 4, 5, 6 };
vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));
vector<int>::iterator pos;
pos = nums.insert(nums.begin() + 1 , 9);
nums.erase(pos);
*pos = 10; //此处报错
当我们删除一个数后,再通过迭代器位置去访问时,就会报错
为甚麽会报错
当我们删除后将一个数删除后者个位置的迭代器也就被删除了,而我们如果再对删除的迭代器位置进行修该访问就会报错
pos=nums.erase(pos);
//只要我们重新接收erase返回的迭代其位置,就可以了
*pos = 10;
//此时不会报错
通过调试,我们会发现,pos的传入地址和传出的地址完全一样,并没有发生变化
为甚麽迭代器会失效
通过vs底层实现的,我们可以看到他返回的迭代器不仅仅是传入的位置,还进行了处理,可见vs在对迭代器进行了处理,以便于检查,只要迭代器被删除过后,就不能再使用,只能接受它返回的正确的迭代器。
从以下的底层代码可以看到vs对迭代器进行的检查,在每次使用迭代器之前都对迭代器进行检查。
将同样的代码放在Linux下进行运行
int main()
7 {
8 int arr[] = { 1, 2, 3, 4, 5, 6 };
9 vector<int> nums(arr, arr + size
of(arr) / sizeof(int));
10
11
12 vector<int>::iterator pos;
13
14 pos = nums.insert(nums.begi
n() + 1 , 9);
15
16 nums.erase(pos);
17
18 *pos = 10;
19
20 for(auto& e: nums)
21 cout<<e<<" ";
22 cout<<endl;
23
24
25 return 0;
[[email protected] test2]$ ./test
1 10 3 4 5 6
在linux 下,代码正常运行并不会报错,结果正确。这是因为在linux下对于迭代器的检查并不严格,所以只要不超过迭代器的访问区间,Linux下一般不会报错。但是有时候我们必须要注意所得结果的正确性。
linux下的erase 的底层源码
template<typename _Tp, typename _Alloc>
133 typename vector<_Tp, _Alloc>::iterator
134 vector<_Tp, _Alloc>::
135 erase(iterator __position)
136 {
137 if (__position + 1 != end())
138 _GLIBCXX_MOVE3(__position + 1, end(), __position);
139 --this->_M_impl._M_finish;
140 _Alloc_traits::destroy(this->_M_impl, this->_M_impl._M_finish);
141 return __position;
(gdb)
142 }
//我们可以看到传入和传出的是一个position,而且也没有太多的检查
而在Linux的底层中在返回时并没有对迭代器进行处理,在进入时也并没有对于原迭代器进行检查,只是对于迭代器的范围进行了检查。所以在不同的平台下,检查的方式不一样,严格程度不一样所以可能得出的结果也不同。
我们再来看这样一份代码
int main()
{
int arr[] = { 1, 2, 3, 4, 5, 6 };
vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));
vector<int>::iterator it = nums.begin();
while (it != nums.end())
{
if (*it % 2 == 0)
nums.erase(it);
++it;
}
for (int i = 0; i<nums.size(); i++)
cout << nums[i] << " ";
return 0;
}
毫无疑问在vs地下会报错,在删完2后,对it进行++时就会报错。
但在linux下则会出现多种情况:
- 当我们所给删除序列为 1 2 3 4 5 6
程序会报出段错误
[[email protected] test_erase]$ ./test
Segmentation fault (core dumped)
通过gdb调试我们可以看到
在我们删除2,4,之后,在进行6的删除的时候因为,超出了迭代器的访问位置而导致的段错误。
- 当我们所给删除序列为 1 2 3 4 5
[[email protected] test_erase]$ ./test
1 3 5 [[email protected] test_erase]$
程序运行正常,且结果正确。
- 当我们所给删除序列为 1 2 8 4 6 5
[[email protected] test_erase]$ ./test
1 8 6 5 [[email protected] test_erase]$
可以看到,在删除的时候,并没有将偶数项全部删除完,是是因为在删除过程中,会将后面的向前覆盖,而返会的位置是当前的位置,下一次++时会将该位置跳过去,所以会出现这种错误。
在给出的三种错误种,我们可以看到有时侯结果运行正确,有时候错误,有时候程序挂掉。所以我们不能在有些时候因为结构正确就认为程序也是正确的。
所以erase 在配合循环使用时要注意
下面为正确的些法
int main()
{
int arr[] = { 1, 2, 3, 4, 5, 6 };
vector<int> nums(arr, arr + sizeof(arr) / sizeof(int));
vector<int>::iterator it = nums.begin();
while (it != nums.end())
{
if (*it % 2 == 0)
it=nums.erase(it); //使用一个迭代器来对返回的迭代器进行接受
else
++it; //因为返回的还是原位置,所以进行判断的时候防止跳过
}
for (int i = 0; i<nums.size(); i++)
cout << nums[i] << " ";
return 0;
}