Go语言各种扩容机制(防止混淆)

本文详细介绍了Go语言中Slice与Map的扩容机制。Slice扩容遵循特定规则以确保高效利用内存,Map则通过增量扩容和平滑扩容策略来优化负载因子,确保数据分布均匀。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Slice扩容

触发

使用append向Slice追加元素时,如果Slice空间不足,将会触发Slice扩容

原理

扩容实际上是重新分配一块更大的内存,将原Slice数据拷贝进新Slice,然后返回新Slice,扩容后再将数据追加进去。

机制

V1.8之前:

扩容容量的选择遵循以下规则:

  • 如果原Slice容量小于1024,则新Slice容量将扩大为原来的2倍;
  • 如果原Slice容量大于等于1024,则新Slice容量将扩大为原来的1.25倍;
// 1.17及以前的版本中
// old指切片的旧容量, cap指期望的新容量
func growslice(old, cap int) int {
    newcap := old
    doublecap := newcap + newcap
    // 如果期望容量大于旧容量的2倍,则直接使用期望容量作为最终容量
    if cap > doublecap {
        newcap = cap
    } else {
        // 如果旧容量小于1024,则直接翻倍
        if old < 1024 {
            newcap = doublecap
        } else {
            // 每次增长大约1.25倍
            for 0 < newcap && newcap < cap {
                newcap += newcap / 4
            }
            if newcap <= 0 {
                newcap = cap
            }
        }
    }
    // 这里忽略了对齐操作
    return newcap
}

V1.8之后:

新扩容容量的选择遵循以下规则:(拥有更平滑的扩容系数)

  • 如果原Slice容量小于256,则新Slice容量将扩大为原来的2倍;
  • 如果原Slice容量大于等于256,则新Slice容量将扩大为原来的  新容量 = (原容量+3*256)/4
// 只关心扩容规则的简化版growslice
func growslice(old, cap int) int {
    newcap := old
    doublecap := newcap + newcap
    if cap > doublecap {
        newcap = cap
    } else {
        const threshold = 256 // 不同点1
        if old < threshold {
            newcap = doublecap
        } else {
            for 0 < newcap && newcap < cap {
                newcap += (newcap + 3*threshold) / 4 // 不同点2
            }
            if newcap <= 0 {
                newcap = cap
            }
        }
    }
    return newcap
}

Map扩容

触发扩容的条件有二个:

  1. 负载因子 > 6.5时,也即平均每个bucket存储的键值对达到6.5个。增量扩容
  2. overflow数量 > 2^15时,也即overflow数量超过32768时。等量扩容/重排

注意:创建溢出桶不属于扩容机制

增量扩容

  • 当负载因子过大时,新开辟buckets空间,bucket数量为之前的 2 倍
  • 新空间被buckets引用,之前的旧空间被oldbuckets引用
  • 之后逐渐将 oldbuckets中的数据 搬迁到 新开辟的 buckets空间中去

考虑到如果map存储了数以亿计的key-value,一次性搬迁将会造成比较大的延时,Go采用逐步搬迁策略,即每次访问map时都会触发一次搬迁,每次搬迁2个键值对当oldbuckets中的键值对全部搬迁完毕后,删除oldbuckets。

下图展示了包含一个bucket满载的map(为了描述方便,图中bucket省略了value区域):

当前map存储了7个键值对,只有1个bucket。此时负载因子为7 > 6.5。再次插入数据时将会触发扩容操作,扩容之后再将新插入键写入新的bucket。注意,因为负载因子的触发,不是创建溢出桶

当第8个键值对插入时,将会触发扩容扩容后示意图如下:

后续对map的访问操作会触发迁移,将oldbuckets中的键值对逐步的搬迁过来。

搬迁完成后的示意图如下:

数据搬迁过程中原bucket中的键值对将存在于新bucket的前面,新插入的键值对将存在于新bucket的后面。

等量扩容/重排

所谓等量扩容,实际上并不是扩大容量,buckets数量不变,重新做一遍类似增量扩容的搬迁动作,把松散的键值对重新排列一次,以使bucket的使用率更高,进而保证更快的存取。
在极端场景下,比如不断地增删,而键值对正好集中在一小部分的bucket,这样会造成overflow的bucket数量增多,但负载因子又不高,从而无法执行增量搬迁的情况,如下图所示:

上图可见,overflow的bucket中大部分是空的,访问效率会很差。此时进行一次等量扩容,即buckets数量不变,经过重新组织后overflow的bucket数量会减少,即节省了空间又会提高访问效率。

<think>好的,我需要回答用户关于C++ vector扩容机制的问题,包括内部实现和源码分析。首先,用户提供的引用中有几个相关的资料,比如引用[2]、[4]、[5]提到了扩容机制,特别是引用[2]中的C++代码示例和扩容时的容量变化,引用[4]和[5]讨论了无参构造器和扩容过程。需要注意的是,用户可能混淆了C++的vector和Java的Vector,因为引用[4]和[5]明显是关于Java的,但用户的问题是关于C++的,所以应该主要参考引用[2]和[3]。 首先,我需要整理C++ vector的扩容机制。根据STL的实现,当vector的size达到capacity时,会分配更大的内存空间,通常是原容量1.5倍或2倍(不同编译器可能不同,比如VS是1.5倍,GCC是2倍)。然后将旧元素拷贝到新空间,释放旧内存。这个过程会影响性能,因此reserve预分配可以优化。 接下来,需要分析源码。例如,push_back操作会检查是否需要扩容,调用reserve或者相关的函数。在扩容时,可能会调用_M_realloc_insert函数(以GCC为例),其中计算新容量,分配内存,移动元素。这部分需要结合源码结构来解释,比如指针如何管理,迭代器失效的问题。 另外,用户提供的引用[2]中的代码示例展示了扩容时地址的变化,说明内存重新分配,这可以用来举例说明扩容发生的情况。比如,当容量不足时,vec.push_back(1)会导致vector扩容,导致存储地址改变。 需要注意的是,C++和Java的扩容机制不同,比如Java的Vector默认增长一倍,而C++的实现依赖于编译器,所以需要明确区分。在回答中应该指出这一点,避免混淆。 然后,生成相关问题,比如扩容策略的不同,性能影响,如何避免频繁扩容等。这些问题可以帮助用户进一步理解。 最后,确保回答结构清晰,分步骤解释扩容机制,结合源码和示例,引用正确的资料(如引用[2]和[3]),并正确标注引用标记。</think>### C++ vector扩容机制解析 #### 一、核心扩容机制 C++ STL中vector的扩容机制遵循以下步骤: 1. **容量检查**:当插入元素时(如`push_back`),若当前`size() == capacity()`,触发扩容。 2. **新容量计算**:不同编译器的扩容策略不同: - **GCC**:新容量 = 原容量 × 2 - **MSVC**:新容量 = 原容量 × 1.5 3. **内存重分配**:分配新的连续内存空间,大小等于新容量。 4. **元素迁移**:将旧元素全部拷贝/移动到新内存(C++11后优先使用移动语义)。 5. **旧内存释放**:销毁旧元素并释放原内存块[^2][^3]。 #### 二、源码实现分析(以GCC为例) 关键函数`push_back`调用链: ```cpp // vector.tcc template<typename _Tp, typename _Alloc> void vector<_Tp, _Alloc>::push_back(const value_type& __x) { if (this->_M_impl._M_finish != this->_M_impl._M_end_of_storage) { // 直接构造元素 } else _M_realloc_insert(end(), __x); // 触发扩容 } // 扩容函数实现 template<typename _Tp, typename _Alloc> void vector<_Tp, _Alloc>::_M_realloc_insert(iterator __position, const _Tp& __x) { const size_type __len = _M_check_len(1, "vector::_M_realloc_insert"); pointer __new_start = _M_allocate(__len); // 分配新内存 // 迁移元素并插入新元素 _M_deallocate(this->_M_impl._M_start, this->_M_impl._M_end_of_storage - this->_M_impl._M_start); // 释放旧内存 } ``` 其中`_M_check_len`计算新容量: ```cpp size_type _M_check_len(size_type __n, const char* __s) const { if (max_size() - size() < __n) __throw_length_error(__s); const size_type __len = size() + std::max(size(), __n); // GCC采用2倍扩容策略 return (__len < size() || __len > max_size()) ? max_size() : __len; } ``` #### 三、示例验证 引用[2]中的代码在VS环境下运行后输出: ``` 0x1e4b668 1 1 0x1e4b668 2 2 0x1e4b668 3 3 ...(前三次扩容后地址变化) 0x1e4b6a8 4 6 // 容量从3扩容到6(1.5倍) ``` 表明MSVC采用1.5倍扩容策略,且每次扩容后内存地址改变。 #### 四、性能优化建议 1. **预分配内存**:使用`reserve(n)`预先分配足够容量,避免多次扩容。 2. **移动语义**:C++11后优先使用`emplace_back`减少拷贝开销。 3. **迭代器失效**:扩容后原有迭代器、指针、引用均失效[^3]。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值