STL的内存分配器

题记:内存管理一直是C/C++程序的红灯区。关于内存管理的话题,大致有两类侧重点,一类是内存的正确使用,例如C++中new和delete应该成对出现,用RAII技巧管理内存资源,auto_ptr等方面,很多C/C++书籍中都使用技巧的介绍。另一类是内存管理的实现,如linux内核的slab分配器,STL中的allocator实现,以及一些特定于某种对象的内存管理等。最近阅读了一些内存管理实现方面的资料和源码,整理了一下,汇编成一个系列介绍一些常用的内存管理策略。

1. STL容器简介

STL提供了很多泛型容器,如vector,list和map。程序员在使用这些容器时只需关心何时往容器内塞对象,而不用关心如何管理内存,需要用多少内存,这些STL容器极大地方便了C++程序的编写。例如可以通过以下语句创建一个vector,它实际上是一个按需增长的动态数组,其每个元素的类型为int整型:

stl::vector<int> array;

拥有这样一个动态数组后,用户只需要调用push_back方法往里面添加对象,而不需要考虑需要多少内存:

array.push_back(10);
array.push_back(2);

vector会根据需要自动增长内存,在array退出其作用域时也会自动销毁占有的内存,这些对于用户来说是透明的,stl容器巧妙的避开了繁琐且易出错的内存管理工作。

2. STL的默认内存分配器

隐藏在这些容器后的内存管理工作是通过STL提供的一个默认的allocator实现的。当然,用户也可以定制自己的allocator,只要实现allocator模板所定义的接口方法即可,然后通过将自定义的allocator作为模板参数传递给STL容器,创建一个使用自定义allocator的STL容器对象,如:

stl::vector<int, UserDefinedAllocator> array;

大多数情况下,STL默认的allocator就已经足够了。这个allocator是一个由两级分配器构成的内存管理器,当申请的内存大小大于128byte时,就启动第一级分配器通过malloc直接向系统的堆空间分配,如果申请的内存大小小于128byte时,就启动第二级分配器,从一个预先分配好的内存池中取一块内存交付给用户,这个内存池由16个不同大小(8的倍数,8~128byte)的空闲列表组成,allocator会根据申请内存的大小(将这个大小round up成8的倍数)从对应的空闲块列表取表头块给用户。

这种做法有两个优点:

1)小对象的快速分配。小对象是从内存池分配的,这个内存池是系统调用一次malloc分配一块足够大的区域给程序备用,当内存池耗尽时再向系统申请一块新的区域,整个过程类似于批发和零售,起先是由allocator向总经商批发一定量的货物,然后零售给用户,与每次都总经商要一个货物再零售给用户的过程相比,显然是快捷了。当然,这里的一个问题时,内存池会带来一些内存的浪费,比如当只需分配一个小对象时,为了这个小对象可能要申请一大块的内存池,但这个浪费还是值得的,况且这种情况在实际应用中也并不多见。

2)避免了内存碎片的生成。程序中的小对象的分配极易造成内存碎片,给操作系统的内存管理带来了很大压力,系统中碎片的增多不但会影响内存分配的速度,而且会极大地降低内存的利用率。以内存池组织小对象的内存,从系统的角度看,只是一大块内存池,看不到小对象内存的分配和释放。

实现时,allocator需要维护一个存储16个空闲块列表表头的数组free_list,数组元素i是一个指向块大小为8*(i+1)字节的空闲块列表的表头,一个指向内存池起始地址的指针start_free和一个指向结束地址的指针end_free。空闲块列表节点的结构如下:

union obj {
        union obj *free_list_link;
        char client_data[1];
};

这个结构可以看做是从一个内存块中抠出4个字节大小来,当这个内存块空闲时,它存储了下个空闲块,当这个内存块交付给用户时,它存储的时用户的数据。因此,allocator中的空闲块链表可以表示成:

obj* free_list[16];

3. 分配算法

allocator分配内存的算法如下:

算法:allocate

输入:申请内存的大小size

输出:若分配成功,则返回一个内存的地址,否则返回NULL

{

    if(size大于128){ 启动第一级分配器直接调用malloc分配所需的内存并返回内存地址;}

    else {

        将size向上round up成8的倍数并根据大小从free_list中取对应的表头free_list_head;

        if(free_list_head不为空){

              从该列表中取下第一个空闲块并调整free_list;

              返回free_list_head;

        } else {

             调用refill算法建立空闲块列表并返回所需的内存地址;

        }

   }

}

算法: refill

输入:内存块的大小size

输出:建立空闲块链表并返回第一个可用的内存块地址

{

     调用chunk_alloc算法分配若干个大小为size的连续内存区域并返回起始地址chunk和成功分配的块数nobj;

    if(块数为1)直接返回chunk;

    否则

    {

         开始在chunk地址块中建立free_list;

         根据size取free_list中对应的表头元素free_list_head;

         将free_list_head指向chunk中偏移起始地址为size的地址处, 即free_list_head=(obj*)(chunk+size);

         再将整个chunk中剩下的nobj-1个内存块串联起来构成一个空闲列表;

         返回chunk,即chunk中第一块空闲的内存块;

     }

}

 

算法:chunk_alloc

输入:内存块的大小size,预分配的内存块块数nobj(以引用传递)

输出:一块连续的内存区域的地址和该区域内可以容纳的内存块的块数

{

      计算总共所需的内存大小total_bytes;

      if(内存池中足以分配,即end_free - start_free >= total_bytes) {

          则更新start_free;

          返回旧的start_free;

      } else if(内存池中不够分配nobj个内存块,但至少可以分配一个){

         计算可以分配的内存块数并修改nobj;

         更新start_free并返回原来的start_free;

      } else { //内存池连一块内存块都分配不了

         先将内存池的内存块链入到对应的free_list中后;

         调用malloc操作重新分配内存池,大小为2倍的total_bytes加附加量,start_free指向返回的内存地址;

         if(分配不成功) {

             if(16个空闲列表中尚有空闲块)

                尝试将16个空闲列表中空闲块回收到内存池中再调用chunk_alloc(size, nobj);

            else {

                   调用第一级分配器尝试out of memory机制是否还有用;

            }

         }

         更新end_free为start_free+total_bytes,heap_size为2倍的total_bytes;

         调用chunk_alloc(size,nobj);

    }

}

 

算法:deallocate

输入:需要释放的内存块地址p和大小size

{

    if(size大于128字节)直接调用free(p)释放;

    else{

        将size向上取8的倍数,并据此获取对应的空闲列表表头指针free_list_head;

       调整free_list_head将p链入空闲列表块中;

    }

}

 

假设这样一个场景,free_list[2]已经指向了大小为24字节的空闲块链表,如图1所示,当用户向allocator申请21字节大小的内存块时,allocaotr会首先检查free_list[2]并将free_list[2]所指的内存块分配给用户,然后将表头指向下一个可用的空闲块,如图2所示。注意,当内存块在链表上是,前4个字节是用作指向下一个空闲块,当分配给用户时,它是一块普通的内存区。

clip_image002

图1 某时刻allocator的状态

clip_image004

图2 分配24字节大小的内存块

4. 小结

STL中的内存分配器实际上是基于空闲列表(free list)的分配策略,最主要的特点是通过组织16个空闲列表,对小对象的分配做了优化。

1)小对象的快速分配和释放。当一次性预先分配好一块固定大小的内存池后,对小于128字节的小块内存分配和释放的操作只是一些基本的指针操作,相比于直接调用malloc/free,开销小。

2)避免内存碎片的产生。零乱的内存碎片不仅会浪费内存空间,而且会给OS的内存管理造成压力。

3)尽可能最大化内存的利用率。当内存池尚有的空闲区域不足以分配所需的大小时,分配算法会将其链入到对应的空闲列表中,然后会尝试从空闲列表中寻找是否有合适大小的区域,

但是,这种内存分配器局限于STL容器中使用,并不适合一个通用的内存分配。因为它要求在释放一个内存块时,必须提供这个内存块的大小,以便确定回收到哪个free list中,而STL容器是知道它所需分配的对象大小的,比如上述:

stl::vector<int> array;

array是知道它需要分配的对象大小为sizeof(int)。一个通用的内存分配器是不需要知道待释放内存的大小的,类似于free(p)。

<think>好的,我现在需要帮助用户了解如何在C++中实现一个自定义的内存分配器,以便用于STL容器。首先,我得回忆一下STL内存分配器的基本要求和实现步骤。 用户可能知道STL容器默认使用std::allocator,但有时候需要自定义分配器来优化性能或管理特定内存区域。那么,如何创建一个符合STL要求的自定义分配器呢? 首先,我需要明确,自定义分配器需要满足哪些标准。STL分配器需要提供特定的类型定义,比如value_type、pointer等,还需要实现allocate、deallocate、construct、destroy等方法。此外,C++11之后,分配器还需要支持拷贝构造和移动语义,以及提供比较运算符,确保不同实例之间的比较正确。 接下来,我需要确定用户可能需要一个简单的例子。例如,一个使用malloc和free的基础分配器。但要注意,STL分配器的rebind模板成员,允许容器内部为其他类型分配内存,比如链表节点的分配。因此,在实现时必须包含rebind结构。 然后,构造和销毁对象时,需要使用placement new和显式调用析构函数。这可能用户不太熟悉,所以需要解释清楚。另外,C++17之后,construct和destroy方法被弃用,但为了兼容性,可能需要保留。 另外,分配器需要满足可复制和可移动的要求,即使不同实例之间也能正确工作。所以,比较操作符需要返回true,表示不同实例可以相互释放内存。 现在,考虑可能的错误点。比如,在allocate函数中,如果没有正确对齐内存,会导致未定义行为。所以,在使用malloc时,虽然通常已经对齐,但在自定义分配策略时需要特别注意对齐问题。 然后,用户可能想了解如何将这个分配器应用到STL容器中,比如vectorlist。这时候,需要提供一个示例,展示如何在模板参数中指定自定义分配器。 最后,相关问题的设计需要围绕实现细节、C++标准要求、性能优化等方面展开。例如,rebind的作用、内存对齐的处理、与默认分配器的性能比较,以及状态管理的问题。 总结一下,回答的结构应该包括实现步骤、代码示例、注意事项,以及相关问题。需要确保代码符合C++标准,并且用户能够理解每个部分的作用。</think><< 在C++中实现自定义STL内存分配器需要遵循allocator的接口规范。以下是关键实现步骤和示例代码: 1. 基本模板结构: ```cpp template <typename T> class CustomAllocator { public: using value_type = T; // 必须的类型别名 // 构造函数(可支持不同分配器类型的转换) CustomAllocator() noexcept = default; template <typename U> CustomAllocator(const CustomAllocator<U>&) noexcept {} // 内存分配 T* allocate(std::size_t n) { auto p = static_cast<T*>(std::malloc(n * sizeof(T))); if (!p) throw std::bad_alloc(); return p; } // 内存释放 void deallocate(T* p, std::size_t) noexcept { std::free(p); } // 支持rebind机制 template <typename U> struct rebind { using other = CustomAllocator<U>; }; }; // 必须实现比较运算符 template <typename T, typename U> bool operator==(const CustomAllocator<T>&, const CustomAllocator<U>&) { return true; } template <typename T, typename U> bool operator!=(const CustomAllocator<T>&, const CustomAllocator<U>&) { return false; } ``` 2. 使用示例: ```cpp // 在STL容器中使用 std::vector<int, CustomAllocator<int>> vec; vec.push_back(42); // 使用自定义分配器的链表 std::list<double, CustomAllocator<double>> myList; ``` 实现要点解释: - 类型别名:必须包含value_type等标准类型定义 - 分配/释放:使用malloc/free实现基础内存管理 - rebind机制:允许容器为内部数据结构分配不同类型的内存 - 比较运算符:保证不同特化的分配器实例可以互相操作 - 异常安全:allocate失败时抛出bad_alloc异常 - 无状态设计:保证不同实例行为一致 注意事项: 1. C++17开始construct/destroy成员被弃用,可使用默认实现 2. 内存对齐需符合类型要求(malloc通常保证基本对齐) 3. 可扩展添加内存追踪、池化分配等高级特性 4. 需要处理类型转换和不同实例间的互操作性
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值