【C++】探索vector内部机制的模拟实现

子有内涵

于 2025-03-28 15:00:00 发布

阅读量1.9k

点赞数 48

文章标签： c++ 开发语言

本文链接：https://blog.youkuaiyun.com/2301_81250340/article/details/146541708

版权

引言：

什么是vector？

vector是一个封装了动态数组的顺序容器，与其他类型容器一样，能够存放各种类型的对象，可以简单的认为，vector是一个能够存放任意类型的动态数组，但与顺序表不同的是vector的成员遍历是三个迭代器，也可以说是三个指针。

template<class T>
class vector
{
public:
	typedef T* iterator;
    //...

private:
	iterator _start=nullptr;
	iterator _finish=nullptr;
	iterator _end_of_storage=nullptr;

};

其中_start指向起始位置，_finish指向有效数据末尾的后一个位置， _end_of_storag指向容量大小末尾的后一个位置。

一、成员函数

1.1构造函数

1.1.1无参构造

只需将三个成员变量置为空指针即可

//无参构造
vector()
	:_start(nullptr)
	, _finish(nullptr)
	, _end_of_storage(nullptr)
{

}

1.1.2使用迭代器区间构造

当我们想要以某个对象的区间来进行初始化时，需要用到模板

//迭代器区间构造
//类模板的成员函数，可以继续是函数模板
template<class Inputiterator>
vector(Inputiterator first, Inputiterator last)
{
	while (first != last)
	{
		push_back(*first);
		++first;
	}
}

1.1.3构造并初始化n个val

vector也支持容器中含有n个值为val的数据，注意在尾插之前要先进行扩容

//n个val构造
vector(size_t n, const T& val=T())
{
	reserve(n);
	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

注：在设计带参构造函数时需要使用匿名对象作为缺省值（ const T& val=T() ），因为T类型不确定，在设置缺省值时只能使用匿名对象的方式。

这里其实还要将n重载为int类型

//n个val构造
vector(int n, const T& val=T())
{
	reserve(n);
	for (size_t i = 0; i < n; i++)
	{
		push_back(val);
	}
}

这是为了防止传两个int型参数时被编译器交给1.1.2中的模板 Inputiterato识别，会报错，因为其中的*first只能对指针和迭代器解引用，而不能对数据解引用。

1.2拷贝构造

开辟一个新空间，在进行一个个拷贝即可

//拷贝构造
vector(const vector<T>& v)
{ 
	_start = new T[v.capacity()];
	//一个个进行深拷贝
	for (size_t i = 0; i < v.size(); ++i)
	{
		_start[i] = v._start[i];
	}
	_finish = _start + v.size();
	_end_of_storage = _start + v.capacity();


}

这里要注意的是：对于自定义类型，不能用memcpy进行拷贝，因为它进行的是浅拷贝，如果模板T是string,vector等自定义类型，则程序结束回收时就会引发内存错误。而对于内置类型则可以用memcpy。

这里还有一种写法更简洁：

//拷贝构造
vector(const vector<T>& v)
{
	//预留空间
	reserve(v.size());
	//深拷贝 遍历尾插
	for (auto& e : v)
	{
		push_back(e);
	}
}

1.3运算符赋值重载

传统写法：开辟一个新空间然后将容器中的数据一个个拷贝过去

//赋值重载
//传统写法
vector <T>& operator=(const vector<T>& v)
{
	if (this != &v)
	{
		//将this清理干净
		clear();
		reserve(v.size());
		for (auto& e : v)
		{
			push_back(e);
		}
	}
	return *this;
}

现代写法：

注意：这里在传参时并没有引用传参，因为这样可以间接调用vector的拷贝构造函数，然后将拷贝构造出来的容器v与this进行交换，即可完成赋值操作，而容器v会在函数调用结束时自动析构进行释放。

//赋值重载现代写法
//v1=v3
//这里不能用&，这样v3就变成v1了，而我们的目的是让v1=v3
vector <T>& operator=( vector<T> v)//传值传参
{
	swap(v);
	return *this;
}

void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}

1.4析构函数

清理资源即可

~vector()
{
	delete[]_start;
	_start = _finish = _end_of_storage;
}

二、元素访问

2.1迭代器

我们访问vector中的元素时，可以用迭代器的形式去遍历

typedef T* iterator;
typedef const T* const_iterator;

非const

//迭代器
iterator begin()
{
	return _start;
}

iterator end()
{
	return _finish;
}

const

const_iterator begin() const 
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

2.2operator[ ]

对于vector中的元素的访问最常用的是下标+[ ]

//访问第i位 数据
T& operator[](size_t i)
{
	assert(i < size());
	return _start[i];
}

三、容量

3.1size

size是有效元素的个数，只需_finish-_start即可

size_t size()const
{
	return _finish - _start;
}

3.2capacity

capacity是空间大小，只需_end_of_storage - _start即可

size_t capacity()const
{
	return _end_of_storage - _start;
}

3.3reserve扩容

这里我们采用的逻辑是：若n>capacity,则扩容到n，若n<capacity则不变化

有一个注意的点是：先将size()记录下来，方便后面操作，因为size()是finish-start，要防止异地扩容原数组释放之后找不到_start指针，进而找不到原数组的大小

//扩容
void reserve(size_t n)
{
	if (n > capacity())
	{
		//先将size()赋值给一个变量 方便后面操作 因为size()是finish-start
		//_start后面是要变得
		size_t old_size = size();
		T* tmp = new T[n];
		//写反了就完蛋
		memcpy(tmp, _start, size() * sizeof(T));
		delete[]_start;
		_start = tmp;
		_finish = tmp + old_size;
		_end_of_storage = tmp + n;
		

	}
}

3.4resize

这里分成三个逻辑：

1.当n<size时，resize要删除字符到指定大小

2.当size<n<capacity，resize会补充有效字符（默认为0）到指定大小

3.当n>capacity，resize会补充有效字符（默认为0）到指定大小

void resize(size_t n, const T& x = T())
{
	if (n < size())
	{
		_finish = _start + n;
	}
	else
	{
		reserve(n);
		while (_finish < _start + n)
		{
			*_finish = x;
			++_finish;
		}
	}

}

四、修改器

4.1尾插push_back

这里要注意会涉及到扩容的问题

//尾插
void push_back(const T&x)
{
	//如果满了
	if (_finish == _end_of_storage)
	{
		reserve(capacity()==0 ? 4 : capacity() * 2);
	}
	*_finish = x;
	++_finish;

}

4.2尾删pop_back

要注意进行判空操作

bool empty()
{
	return _start == _finish;
}

//尾删
void pop_back()
{
	assert(!empty());
	--_finish;
}

4.3insert

我们要从pos位置，先去挪动pos后面的数据，从后往前挪，避免数据覆盖，挪完之后再在pos位置插入数据即可，同时我们也需要插入数据之后的扩容问题

//在pos位置插入
iterator insert(iterator pos, const T& x)
{

	
	//扩容
	if (_finish == _end_of_storage)
	{
		
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		
	}
	
	iterator end = _finish - 1;
	while (end >= pos)
	{
		//把pos之后的数据一个个往后挪
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;
	
	return pos;
}

注：这里存在迭代器失效的问题

1.若存在扩容，扩容完之后，当前对象的_start已经指向了新的空间，而pos还指向原来的已经释放了的空间，这时候pos就有点类似野指针的问题，造成pos迭代器失效。

这种情况的解决方法可以记录pos的相对位置，以便在新空间中还能找到正确的pos位置

2.不存在扩容，但是由于数据从后往前依次挪动而pos指向的位置不变，所以pos这个迭代器也已经失效，位置意义已经改变。

所以迭代器insert之后就不要直接访问，如果要访问就要更新这个失效的迭代器的值

//在pos位置插入
iterator insert(iterator pos, const T& x)
{

	
	//扩容
	if (_finish == _end_of_storage)
	{
		//需要记录pos的相对位置，避免迭代器失效的问题
		size_t len = pos - _start;
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;
	}
	
	iterator end = _finish - 1;
	while (end >= pos)
	{
		//把pos之后的数据一个个往后挪
		*(end + 1) = *end;
		--end;
	}
	*pos = x;
	++_finish;
	
	return pos;
}

4.4erase

这里挪动数据需要一个个往前挪，防止覆盖

iterator erase(iterator pos)
{
	assert(pos<_finish && pos>_start);

	iterator it = pos + 1;//记录pos下一个元素的位置
	//从后往前挪
	while (it != v.end())
	{
		*(it - 1) = *it;
		++it;
	}
	--_finish;
	return pos;
}

注：erase删除pos位置元素后，pos位置之后的元素会往前挪，没有导致底层空间的改变，理论上迭代器不会失效，但是：如果pos刚好是最后一个元素，删完之后pos刚好是end的位置，而end位置是没有元素的，那么pos就失效了。因此删除vector中任意位置上的元素时，vs就认为该位置迭代器失效了。

测试：