vector

夢に向かって進む

已于 2023-08-22 17:34:47 修改

阅读量319

点赞数

分类专栏： C++ 文章标签： c++

于 2023-08-10 17:50:04 首次发布

本文链接：https://blog.youkuaiyun.com/qq_66483104/article/details/132215178

版权

C++ 专栏收录该内容

19 篇文章

订阅专栏

1.2.2 vector iterator的使用

2.2代码解析和使用memcpy拷贝存在的问题

1.vector的介绍及使用

1.1vector的介绍

1.vector是表示可变大小数组的序列容器。

2.就像数组一样，vector也采用的连续存储空间来储存元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

3.本质讲，vector使用动态分配数组来储存它的元素。当新元素插入的时候，这个数组需要重新分配大小为了增加储存空间(在进行插入新元素时如果空间不够需要重新分配空间，vector不会进行原地扩容 )。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小(后面插入的元素如果空间大小足够不会进行重新分配空间)。

4. vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
5. 因此，vector占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。
6. 与其它动态序列容器相比（deque, list and forward_list）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起list和forward_list统一的迭代器和引用更好。

1.2vector的使用

vector学习时一定要学会查看文档：https://cplusplus.com/reference/vector/vector/，vector在实际中非常的重要，在实际中我们熟悉常见的接口就可以，下面列出了哪些接口是要重点掌握的。

1.2.1 vector 的定义

构造函数声明	接口说明
vector()（重点）	无参构造
vector（size_type n, const value_type& val = value_type()）	构造并初始化n个val
vector (const vector& x); （重点）	拷贝构造
vector (InputIterator first, InputIterator last);	使用迭代器进行初始化构造

1.2.2 vector iterator的使用

iterator的使用	接口说明
begin + end (重点)	获取第一个数据位置的iterator/const_iterator，获取最后一个数据的下一个位置的iterator/const_iterator
rbegin + rend	获取最后一个数据位置的reverse_iterator，获取第一个数据前一个位置的reverse_iterator

1.2.3 vector 空间增长问题

容量空间	接口说明
size	获取数据个数
capacity	获取容量大小
empty	判断是否为空
resize	改变vector的size和capacity(不会进行缩容，根据平台决定)
reserve	只改变vector的capacity(不会进行缩容，根据平台决定)

capacity的代码在vs和g++下分别运行会发现，vs下capacity是按1.5倍增长的，g++是按2倍增长的。这个问题经常会考察，不要固化的认为，vector增容都是2倍，具体增长多少是根据具体的需求定义的。vs是PJ版本STL，g++是SGI版本STL。
reserve只负责开辟空间，如果确定知道需要用多少空间，reserve可以缓解vector增容的代价缺陷问题。
resize在开空间的同时还会进行初始化，影响size。

1.2.4 vector 增删查改

vector 增删查改	接口说明
push_back	尾插
pop_back	尾删
find	查找 (这个是算法模块里面实现的，不是vector的成员接口)
insert	在position(位置，简称pos)之前插入val
erase	删除position位置的数据
swap	交换两个vector的数据空间
operator[]	像数组一样访问数据元素

1.2.5 vector 迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装，比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。

对于vector可能会导致其迭代器失效的操作有：

1. 会引起其底层空间改变的操作，都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。

#include <iostream>
using namespace std;
#include <vector>
int main()
{
	vector<int> v{1, 2, 3, 4, 5, 6};
	auto it = v.begin();
	// 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容
	// v.resize(100, 8);
	// reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变
	// v.reserve(100);
	// 插入元素期间，可能会引起扩容，而导致原空间被释放
	// v.insert(v.begin(), 0);
	// v.push_back(8);
	// 给vector重新赋值，可能会引起底层容量改变
	v.assign(100, 8);
	/*
	出错原因：以上操作，都有可能会导致vector扩容，也就是说vector底层原理旧空间被释放掉，
	而在打印时，it还使用的是释放之间的旧空间，在对it迭代器操作时，实际操作的是一块已经被释放的
	空间，而引起代码运行时崩溃。
	解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，只需给it重新
	赋值即可。
	*/
	while (it != v.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	return 0;
}

2.指定位置元素的删除操作--erase

#include <iostream>
using namespace std;
#include <vector>
int main()
{
	int a[] = { 1, 2, 3, 4 };
	vector<int> v(a, a + sizeof(a) / sizeof(int));
	// 使用find查找3所在位置的iterator
	vector<int>::iterator pos = find(v.begin(), v.end(), 3);
	// 删除pos位置的数据，导致pos迭代器失效。
	v.erase(pos);
	cout << *pos << endl; // 此处会导致非法访问
	return 0;
}

erase删除pos位置元素后，pos位置之后的元素会往前搬移，没有导致底层空间的改变，理论上讲迭代
器不应该会失效，但是：如果pos刚好是最后一个元素，删完之后pos刚好是end的位置，而end位置是
没有元素的，那么pos就失效了。因此删除vector中任意位置上元素时，vs就认为该位置迭代器失效
了。

1.2.5 vector 在oj中的使用

1.只出现一次的数字

class Solution 
{
public:
    int singleNumber(vector<int>& nums)
    {
        int value = 0;
        for(auto e : nums) 
            value ^= e;
            
        return value;
    }
};

2.杨辉三角

class Solution {
public:
    vector<vector<int>> generate(int numRows) 
    {
        vector<vector<int>> vv;
        vv.resize(numRows);//开辟numrows行空间
        for(size_t i = 0; i < vv.size(); i++)
        {
            vv[i].resize(i + 1, 0);
            vv[i][0] = vv[i][i] = 1;//把每一行第一个和最后一个初始化为1
        }

        for(size_t i = 0; i < vv.size(); i++)
        {
            for(size_t j = 0; j < vv[i].size(); j++)
            {
                if(vv[i][j] == 0)
                {
                    vv[i][j] = vv[i - 1][j] + vv[i - 1][j - 1];
                }
            }
        }

        return vv;
    }
};

3.电话号码的字母组合

class Solution {
    string strA[10] = {"", "", "abc", "def", "ghi", "jkl", "mno", "pqrs", "tuv", "wxyz"};
public:
    void Combine(string digits, int level, string combineStr, vector<string>& v)
    {
        if(level == digits.size())//结束条件
        {
            v.push_back(combineStr);
            return;
        }

        int num = digits[level] - '0';
        string str = strA[num];
        for(size_t i = 0; i < str.size(); i++)
        {
            Combine(digits, level + 1, combineStr + str[i], v);
        }
    }
    vector<string> letterCombinations(string digits) 
    {
        vector<string> v;
        if(digits.empty())
            return v;

        Combine(digits, 0, "", v);
        return v;
    }
};

2.vector深度剖析及模拟实现

2.1完整代码

//ReverseIterator.h
namespace bit
{
	template<class Iterator, class Ref, class Ptr>//Ref表示引用类型，Ptr表示指针类型
	struct ReverseIterator//定义一个反向迭代器的模板类
	{
		typedef ReverseIterator<Iterator, Ref, Ptr> Self;//重命名
		Iterator _it;//成员

		ReverseIterator(Iterator it)
			:_it(it)
		{}
		Ref operator*()
		{
			Iterator tmp = _it;
			return *(--tmp);
		}
		Ptr operator->()
		{
			return &(operator*());
		}
		Self& operator++()
		{
			--_it;
			return *this;
		}
		Self operator++(int)
		{
			Self tmp = *this;
			--_it;
			return tmp;
		}
		Self& operator--()
		{
			++_it;
			return *this;
		}
		Self& operator--(int)
		{
			Self tmp = *this;
			++_it;
			return tmp;
		}
		bool operator!=(const Self& s) const
		{
			return _it != s._it;
		}
	};
}
//vector.h
#define _CRT_SECURE_NO_WARNINGS 1

#pragma once
#include <cstdlib>
#include <iostream>
#include <vector>
#include <assert.h>
#include <cstdlib>
#include <cstring>
#include "ReverseIterator.h"
using namespace std;

namespace bit
{
	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;

		typedef ReverseIterator<iterator, T&, T*> reverse_iterator
		typedef ReverseIterator<const_iterator, const T&, const T*> const_reverse_iterator;

		reverse_iterator rbegin()
		{
			return end();
		}

		reverse_iterator rend()
		{
			return begin();
		}

		const_reverse_iterator rbegin() const
		{
			return end();
		}

		const_reverse_iterator rend() const
		{
			return begin();
		}

		iterator begin()
		{
			return _start;
		}

		iterator end()
		{
			return _finish;
		}

		const_iterator begin() const
		{
			return _start;
		}

		const_iterator end() const
		{
			return _finish;
		}

		vector()
			/*:_start(nullptr)
			,_finish(nullptr)
			,_endofstorage(nullptr)*/
		{}

		//vector<int> v(10, 1);
		//vector<int> v1(10u, 1);
		//vector<int> v2(10, "111");
		//这种写法有可能无法通过编译，因为有可能在编译会调用到下面的函数模板导致报错，导致第一种方法调用失败，所以增加第二种写法
		//那是为什么呢？因为10和1都是int类型可以调用下面的函数模板，函数模板又是迭代器类型进行解引用就会报错
		//vector<int> v(10u, 1);或者在10后面加个u这样就会被推到为无符号类型就可以调用第一种方法
		vector(size_t n, const T& val = T())//第一种方法
		{
			resize(n, val);
		}
		vector(int n, const T& val = T())//第二种方法
		{
			resize(n, val);
		}
		//[first, last) - 左闭右开
		template<class InputIterator>//函数模板 - 写成函数模板是为了支持其他类型的迭代器
		vector(InputIterator first, InputIterator last)
		{
			while (first != last)
			{
				push_back(*first);
				++first;
			}
		}

		vector(const vector<T>& v)
			/*:_start(nullptr)
			, _finish(nullptr)
			, _endofstorage(nullptr)*/
		{
			_start = new T[v.capacity()];
			//memcpy(_start, v._start, sizeof(T) * v.size());//这里的这种写法一样需要注意自定义类型的出现的浅拷贝问题
			for (size_t i = 0; i < v.size(); i++)
			{
				_start[i] = v._start[i];//如果vector储存的是string类型，这里的本质是调用string(自定义类型)的赋值重载
			}
			_finish = _start + v.size();
			_endofstorage = _start + v.capacity();
		}

		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);//加上std是为了防止自定义的swap和库函数的swap进行冲突
			std::swap(_finish, v._finish);
			std::swap(_endofstorage, v._endofstorage);
		}

		vector<T>& operator=(vector<T> v)
		{
			swap(v);
			return *this;
		}

		~vector()
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endofstorage = nullptr;
			}
		}
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				size_t sz = size();
				T* tmp = new T[n];
				if (_start)
				{
					//memcpy(tmp, _start, sizeof(T) * sz);//为了防止vector中的string(自定义类型)类型只进行浅拷贝
					//所以使用循环的方法进行一个一个的深拷贝
					for (size_t i = 0; i < sz; i++)
					{
						tmp[i] = _start[i];
					}
					delete[] _start;
				}

				_start = tmp;
				_finish = _start + sz;
				_endofstorage = _start + n;
			}
		}

		//在c++有了模板之后对内置类型也进行了升级，使他们能够调用默认构造
		//比如 T() 如果是自定义类型会调用自定义的构造函数，但是如果是内置类型呢？比如：
		//int i = int (); i 会被初始化为0
		//int j = int (1); j 会被初始化为1
		//根据结果他们会自定义调用自己的默认构造
		void resize(size_t n, const T& val = T())//使用模板参数的匿名对象作为缺省值，这么写是因为传入不可能仅仅是一种类型
		{
			//有两种情况，第一种是resize(n),n < 小于size
			//第二种情况，resize(n) n > size 或者 n > capacity，所以需要先检查空间是否足够
			if (n < size())
			{
				_finish = _start + n;
			}
			else
			{
				reserve(n);
				while (_finish != _start + n)
				{
					*_finish = val;
					++_finish;
				}
			}
		}

		void push_back(const T& x)
		{
			if (_finish == _endofstorage)
			{
				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);
			}

			*_finish = x;//把x放入地址内
			++_finish;
		}

		void pop_back()
		{
			erase(--end());
		}

		size_t capacity() const
		{
			return _endofstorage - _start;
		}

		size_t size() const
		{
			return _finish - _start;
		}

		T& operator[](size_t pos)
		{
			assert(pos < size());

			return _start[pos];
		}

		const T& operator[](size_t pos) const
		{
			assert(pos < size());

			return _start[pos];
		}

		//使用返回值解决外部迭代器失效问题-
		iterator insert(iterator pos, const T& x)//任意插入
		{
			assert(pos >= _start && pos <= _finish);

			if (_finish == _endofstorage)
			{
				size_t len = pos - _start;//修正

				size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
				reserve(newcapacity);

				pos = _start + len;//修正pos，解决内部迭代器失效(pos)
			}//在进行扩容时，如果重新分配空间pos迭代器会失效，因为pos指向在原来的久空间

			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = x;
			++_finish;

			return pos;
		}

		iterator erase(iterator pos)//任意删除
		{
			assert(pos >= _start && pos < _finish);//assert只有在条件为假时才执行

			iterator it = pos + 1;
			while (it != _finish)
			{
				*(it - 1) = *it;
				++it;
			}

			--_finish;

			return pos;
		}

	private:
		iterator _start = nullptr;//指向起始位置
		iterator _finish = nullptr;//指向最后一个元素的下一个位置，也是用来储存值的，先解引用在放入值，然后++到下一个位置
		iterator _endofstorage = nullptr;//空间容量大小
	};
}

//main.cpp
#define _CRT_SECURE_NO_WARNINGS 1

#include "vector.h"

void test_vector1()
{
	bit::vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;

	for (size_t i = 0; i < v1.size(); i++)
	{
		v1[i]++;
	}
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector2()
{
	bit::vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);
	v1.push_back(5);
	v1.push_back(5);
	v1.push_back(5);

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
	//迭代器失效(内部迭代器失效) - 在进行扩容的时候会失效，
	//因为扩容重新分配了新空间，而迭代器没有指向新空间，还是指向原来的空间
	v1.insert(v1.begin(), 100);
	
	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;

	//迭代器失效(外部迭代器失效) - 在进行扩容的时候会失效
	bit::vector<int>::iterator p = v1.begin() + 3;
	v1.insert(p, 300);

	//禁止使用这种方法
	//*p += 10;//危险行为
	//解决方法使用返回值，让迭代器(p)重新接受返回值

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector3()
{
	bit::vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);
	v1.push_back(6);

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;

	v1.erase(v1.begin());//这种写法没有问题，但是换一种呢？比如下面这种：
	//bit::vector<int>::iterator it = v1.begin() + 4;//删除尾巴后面的数据就会出现错误
	//v1.erase(it);//后面进行访问时迭代器就失效
	erase以后，迭代器失效了，不能访问
	vs进行强制检查，访问会直接报错
	//cout << *it << endl;
	//++it;
	//cout << *it << endl;

	bit::vector<int>::iterator it = v1.begin();
	while (it < v1.end())
	{
		if (*it % 2 == 0)
			it = v1.erase(it);//解决迭代器失效就是使用返回值进行返回，然后让迭代器重新接受新迭代器
		else
			++it;
	}

	//总结：vector的erase和insert迭代器对象后，不能再访问这个迭代器
	//我们认为它失效了，访问结果是未定义的，所以需要设置一个新的迭代器作为返回值，然后接收这个返回值

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector4()
{
	bit::vector<int> v1;
	v1.resize(10, 0);

	for (auto e : v1)
	{
		cout << e << " ";
	}
	cout << endl;

	//int k = 0;
	//int i = int();
	//int j = int(1);
}

void test_vector5()
{
	bit::vector<int> v1;
	v1.push_back(1);
	v1.push_back(2);
	v1.push_back(3);
	v1.push_back(4);
	v1.push_back(5);
	v1.push_back(6);

	bit::vector<int> v2(v1);
	v2 = v1;

	for (auto e : v2)
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector6()
{
	vector<string> v;
	//这里藏有一个隐藏的深拷贝的问题
	//问题在于vector中的每一个string(自定义类型)对象在进行扩容时只进行了浅拷贝
	v.push_back("11111");//字符串会自动进行隐式类型转换为string类型
	v.push_back("22222");
	v.push_back("33333");
	v.push_back("44444");
	v.push_back("55555");

	for (auto& e : v)//这里加上引用是为了减少string类型进行赋值拷贝的开销
	{
		cout << e << " ";
	}
	cout << endl;
}

void test_vector7()
{
	bit::vector<int> v(10);
	for (int i = 0; i < v.size(); i++)
	{
		v[i] = i;
	}
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	
	bit::vector<int>::reverse_iterator rit = v.rbegin();
	while (rit != v.rend())
	{
		cout << *rit << " ";
		rit++;
	}
}

int main()
{
	test_vector7();

	return 0;
}