手撕STL之Vector的实现 | 顺序表的增删查改

前言

本文将带你从零开始实现STL库中Vector,编写常用的Vector接口。通过复现Vector的功能,可以让你对顺序表的增删查改有更深入的理解,能更深入地体会C++的内存管理风格。文中还将介绍深拷贝的两种实现,传统写法以及现代写法。博主也是初学者,如果有表述不对的地方,还请大佬多多指教。

当然,在继续深入Vector,尝试实现它之前,一定先能熟练使用,并且对数据结构中顺序表的原理有一定的了解。

Vector的常用接口

Vector的本质是用动态数组实现的一个顺序表,所以想要实现Vector的基本功能,就需要有数据结构中顺序表的增删查改原理的基本知识。接下来,我会以Vector的常用接口为例,讲解顺序表的增删查改。如果觉得纯文字有些抽象,可以结合顺序表-数组 | 图码观看直观的增删查改的动图。

Push_back()

  1. 检查顺序表是否有足够的容量来容纳新插入的元素,如果没有,则需要扩容。
  2. 直接将数组末尾的值改为要插入的元素
  3. 将顺序表的size()加一

伪代码如下:

FUNCTION Push_back(element)
    IF 容量<已有元素个数加插入元素个数
    	扩容

	在顺序表的末尾插入element
	增加顺序表的元素个数
	return;

Insert()

  1. 先检查顺序表的容量,确定是否需要扩容。
  2. 将插入位置之后的n个元素向后移动(n为插入元素的数量),以为新元素腾出空间。
  3. 将新元素复制或移动到顺序表的对应位置。

伪代码如下:

FUNCTION Insert(sequence, index, element)
    IF 插入位置index不合法
        RETURN "插入位置无效"
    
    IF 容量<已有元素个数加插入元素个数
    	扩容

    FOR 从后向前移动元素,为新元素腾出空间
	
	在index的位置处插入element
	增加顺序表的元素个数
	return;

Pop_back()

直接将顺序表的末尾标记向前移动,并将元素个数减一即可。因为再在顺序表的末尾插入的时候,就能将原数据覆盖,从而达到了尾删的效果。

Erase()

相对Pop_back()较难一些,因为涉及到数据的挪动,需要注意下标与顺序表的实际范围。

伪代码如下:

FUNCTION Erase(sequence, index)
    IF 删除位置index不合法
        RETURN "删除位置无效"
        
    FOR 从删除位置开始,向前移动元素
	减小顺序表的长度

Vector的模拟实现

本文只实现最最常用的Vector接口,如果有其他接口想要实现,可以参考下面这个链接:

vector - C++ Reference

由于目标是实现Vector,所以一下接口实际是Vector类的成员函数,但是为了方便博客,从而分开为独立的函数。

成员函数及迭代器

我们使用三个成员函数实现Vector,是,三个指针分别标识顺序表的头,数据的尾以及内存的尾。

private:
		T* _start = nullptr;
		T* _end = nullptr;
		T* _storage_end = nullptr;

因此,奠定了Vector的本质是一个数组,所以迭代器的实现也很简单,直接封装指针即可:

typedef T* iterator;
typedef const T* const_iterator;

Vector的构造函数及析构函数

指针作为内置类型,不需要专门写构造函数,但是可以使用C++11标准的前置构造声明,让编译器调用用默认的构造函数。

vector() = default;

其他构造均可以利用push_back()接口实现:通过遍历原Vector,将原Vector的元素依次插入新的Vector:

vector(const vector<T>& v) {
	reserve(v.size());
	for (auto& e : v) {
		push_back(e);
	}
}

template<class InputIterator>
vector(InputIterator start, InputIterator end) {
	reserve(end - start);
	while (start != end) {
		push_back(*start);
		start++;
	}
}

vector(size_t n, const T& val = T()) {
	reserve(n);
	int cot = n;
	while (n--) {
		push_back(T);
	}
}

vector(int n, const T& val = T()) {
	reserve(n);
	int cot = n;
	while (n--) {
		push_back(val);
	}
}

析构函数先释放内存,然后将三个指针置空:

~vector() {
    if (_start)
    {
        delete[] _start;
        _start = _end = _storage_end = nullptr;
    }
 }

“增”(Create)

增主要涉及的接口就是push_back()及insert(),实现思路与顺序表原理一致,直接上代码:

void push_back(const T& x) {
	if (_end == _storage_end)
        //检查顺序表的容量,如果为空,初始化为4
        //否则,执行二倍扩容
		reserve(capacity() == 0 ? 4 : capacity() * 2);

	*_end = x;
	_end++;
}

iterator insert(iterator pos, const T& x) {
    assert(pos >= _start);
    assert(pos <= _end);

    size_t positon = pos - _start;
    if (size() == capacity()) {
        reserve(capacity() == 0 ? 4 : capacity() * 2);
        pos = _start + positon;
    }
    iterator cur = _end;
    while (cur > pos) {
        *cur = *(cur - 1);
        --cur;
    }
    *cur = x;
    _end++;
    return pos;
}

iterator insert(iterator pos, size_t n, const T& x) {
    int position = pos - _start;
    if (size() + n < capacity()) {
        reserve(capacity() == 0 ? n : capacity() * 2);
        pos = _start + position;
    }
    _end += n; 
    iterator cur = _end - 1;
    while (cur >= pos + n) {
        *cur = *(cur - n);
        cur--;
    }
    while (cur >= pos) {
        *cur = x;
        --cur;
    }
    return pos;
}

“删”(Delete)

如果上面的能搞定,那么“删”更是不在话下了,小菜一叠:)

void pop_back() {
    assert(!empty());
    --_end;
}

iterator erase(iterator pos) {
    iterator it = pos;
    while (it != end()) {
        *it = *(it + 1);
        it++;
    }
    --_end;
    return pos;
}

iterator erase(iterator head, iterator tail) {
    size_t change = tail - head;
    iterator it_pre = head;
    iterator it_cur = tail;
    while (it_cur != end()) {
        *it_pre = *it_cur;
        ++it_pre;
        ++it_cur;
    }
    _end-=change;
    return head;
}

“查”(Read)

查操作涉及对顺序表属性的获取,如存储的元素,顺序表容量等等。由于Vector底层是数组的先天优势,为了获得这些属性,往往只需要对成员变量进行加减运算即可,直接看代码也能理解背后的意思。

//_end指向顺序表最后一个元素的下一个位置(隐含+1)
//_start指向顺序表的第一个元素,所以直接相减记得元素个数
//一定要对this加const
size_t size() const{
    return _end - _start;
}

size_t capacity() const{
    return _storage_end - _start;
}

//Vector的底层是数组,所以直接运算符重载就能模拟数组行为
T& operator[](size_t pos) {
    assert(pos < size());
    return _start[pos];
}

const T& operator[](size_t pos) const {
    assert(pos < size());
    return _start[pos];
}

iterator begin() {
    return _start;
}

//end()为顺序表的最后一个元素的下一个位置
iterator end() {
    return _end;
}

const_iterator begin() const{
    return _start;
}

const_iterator end() const {
    return _end;
}

//由于_end指向顺序表最后一个元素的下一个位置,
//所以当头尾指针重合即代表没有元素,顺序表为空
bool empty() {
    return _end == _start;
}

“改”(Update)

改是Vector实现的重头戏。如果细心阅读了上面的代码,一定会发现,我们在做增删查的操作的时候,其实都没有涉及底层的数组的初始化,这一切其实都是在reserve()中完成的。reserve()不仅肩负着Vector的初始化,还涉及了元素的深拷贝,任务繁重。详细的代码解读见注释。

void reserve(size_t n) {
    //不进行缩小容量的操作
    if (capacity() < n) {
        size_t old_size = size();
        T* temp = new T[n];
        //要进行深拷贝,不能直接用memcpy
        //赋值构造中就隐藏了深拷贝的实现
        for (size_t i = 0; i < old_size; i++) {
            temp[i] = _start[i];
        }
        delete[] _start;//new时有[],delete时一定要对应使用

        //同时还可以做到指针初始化的作用
        _start = temp;
        _end = temp + old_size;
        _storage_end = temp + n;
    }
}

resize()也可以偷懒的使用push_back()进行实现,因为如果不考虑顺序表大小减小的操作,其本质上其实也是重复的尾插数据。

void resize(size_t n, vector<T>& e = T()) {
    if (n > size()) {
        reserve(n);
        int cot = n - size();
        while (cot--) {
            push_back(e);
        }
    }
}
深拷贝的传统与现代

我认为这个小节是这篇博客最精华的地方,带你详细搞懂深拷贝的前世今生。

在较老的C++标准中,如 C++98/03 标准中,实现深拷贝通常需要手动编写拷贝构造函数和拷贝赋值运算符。以Vector为例,当我们实现赋值运算符重载时,传统写法要求你手动对底层的每一个数据进行拷贝,这种方法是直接而明确的,但往往考虑的细节就比较多。

  1. 检查不能对自己进行赋值。
  2. 申请开辟一片与右值大小一致的空间。
  3. 对右值的每一个元素深拷贝,即需调用其构造函数。
  4. 然后处理this的成员变量。
vector<T>& operator=(vector<T>& v) {
    if (this != &v) {
        clear();
        _start = new T[v.size()];
        for (int i = 0;i<v.size();i++) {
            _start[i] =*(new T(v[i]));
        }
        _end = _start + v.size();
        _storage_end = _start + v.capacity();
    }
    return *this;
}

void clear() {
    _end = _start;
}

随着C++的标准更新,便有了新的深拷贝写法。现代写法真正释放了程序员双手,实现自动化深拷贝。在现代写法中,拷贝构造函数使用了初始化列表等直接初始化成员,这是更高效的做法。写一次拷贝构造函数,此后就能一劳永逸了。

vector<T>& operator= (vector<T>& v) {
    if (this != &v) {
        vector<T> temp(v);	
        swap(temp);
    }
    return *this;
}

void swap(vector<T>& v) {
    std::swap(_start, v._start);
    std::swap(_end, v._end);
    std::swap(_storage_end, v._storage_end);
}

谢谢你的阅读,各位程序员1024节快乐!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值