这几天在研究stl的内存配置器,作用是防止零散的申请内存块导致过多的内存碎片。
大体思路是:
维护一个freelist, 一个内存块链表,就是一个链表,链表上的每一个节点都一个指针指向一块内存块,如果有申请内存,就直接将此链表上的一个内存块分配出去;
如果在链表上找不到合适的内存块,或者说大小为n的内存块已经被分配完了,这时就需要从内存池中拿到一大块内存,然后再将这大块内存按照大小为n进行连接成链表再放入freelist中,显然内存池中有一块很大的内存块,这个大内存块已经分配好了。
但是如果内存池中的内存块也用完了,这时才需要用malloc再申请一块大内存块。
一般情况下我们构建单链表时需要创建如下的一个结构体。
struct Obj
{
Obj *next;
Char* p;
Int iSize;
}
next指针指向下一个这样的结构,p指向真正可用空间,iSize用于只是可用空间的大小,在其他的一些内存池实现中,还有更复杂的结构体,比如还包括记录此结构体的上级结构体的指针,结构体中当前使用空间的变量等,当用户申请空间时,把此结构体添加的用户申请空间中去,比如用户申请12字节的空间,可以这样做
Obj *p = (Obj*)malloc(12+sizeof(Obj));
p->next = NULL;
p->p = (char*)p+sizeof(Obj);
p->iSize = 12;
但是,我们并没有采用这种方式,这种方式的一个缺点就是,用户申请小空间时,内存池加料太多了。比如用户申请12字节时,而真实情况是内存池向内存申请了12+ sizeof(Obj)=12+12=24字节的内存空间,这样浪费大量内存用在标记内存空间上去,并且也没有体现索引表的优势
如图所示:
红色为结点,蓝色为结点指向的内存块
在sgi中是这样定义的:
union Obj
{
Obj *next;
char client_data[1];
}
next指向下一个内存块,这个内存块最开始的部分放有next, 当将这个内存块给客户时,也把next所占的内存给客户,也就是说这个链表不占用额外的内存空间。
如图所示:
途中一共四个内存块,next/client_data就在各自的内存块中。由于union的特性,如果看next,这个变量指向的是下一块内存块的地址;如果看client_data,就可以将其看做柔性数组进行理解,client_data是个指针,指向的是其所在内存块的位置,就是讲client_data看做一个数组。
个人认为,client_data完全没有用途,sgi只所以还保留client_data只是为了便于理解。
所以在我个人实现的内存配置器,就省略了client_data
还有一个问题:
为什么在泛型中用到了template<int inst>, 而在之后的实现中却没有用到inst?
至于inst应该是为了生成不同的实例,在多线程环境下可以提高速度。举个例子:比如你有两个线程,A调用allocate分配8个字节,正在把这块内存从free_list取下是时,系统调度将A停下B开始执行,恰好B也要分配8个字节,于是把分配给A的抢了过来(因为free_list没有更新,而且整个allocate的数据都是静态的,被整个class共享),A接着运行,他并不知道B已经拿走了这块内存,结果同一块内存同一时间分给了两个线程,错误产生了。要避免这种错误就必须加锁,细节你可以看STL原码,速度自然变慢。解决这种问题的办法就是利用inst,为不同的线程指定不同的inst生成不同的静态memeber data。不同的线程有不同的free_list,自然就不用加锁了!
#ifndef C_ALLOC_H
#define C_ALLOC_H
#include <stdio.h>
#include <stdlib.h>
enum {ALIGN = 8};//
enum {MAX_BYTES = 128};
enum {NFREELISTS = 16};
#define __THROW_BAD_ALLOC std::cerr << "out of memory " <<endl; exit(1)
//第一级配置器
template <int inst>//这个模板参数在单线程中没有用,主要用于多线程。__malloc_alloc_template<0>,__malloc_alloc_template<1>就实例化出两个不同的类,可以用于两个不同的线程中,这样既不用加锁也不会减速
class __malloc_alloc_template {
private:
//oom: out of memory
static void * oom_malloc( size_t);
static void * oom_realloc(void *, size_t);
static void (* __malloc_alloc_oom_handler )();//这是个函数指针,是一个成员变量,而不是成员函数
public:
static void * allocate (size_t n) {
void * result = malloc(n);
if (0 == result) result == oom_malloc(n);
return result;
}
static void deallocate(void *p, size_t) {
free(p);
}
static void *reallocate(void *p, size_t /*old size*/, size_t new_sz) {
void *result = realloc(p,new_sz);
if (0 == result) return = oom_realloc(p, new_sz);
return result;
}
static void (* set_malloc_handler (void (*f)())) () { //set_malloc_handler是一个函数,其参数是一个函数指针,其返回值也是一个函数指针。这地方要好好揣摩。如果将set_malloc_handler (void (*f)()) 看做p,则就是 (*p)(),set_malloc_handler的返回值就是p
void (* old)() = __malloc_alloc_oom_handler;
__malloc_alloc_oom_handler == f;
return old;
}
};
template<int inst>
void (*__malloc_alloc_template<inst>::__malloc_alloc_oom_handler) () = 0;
template <int inst>
void * __malloc_alloc_template<inst>::oom_malloc(size_t n) {
void (* my_malloc_handler) ();
void *result;
for(;;) {
my_malloc_handler = __malloc_alloc_oom_handler;
if (0 == my_malloc_handler) {__THROW_BAD_ALLOC;}
(*my_malloc_handler) ();//如果用户自定义处理函数,则此函数会寻找可用的内存,并释放这个内存
result = malloc(n);//再重新尝试配置内存
if (result) return result;
}
}
template <int inst>
void * __malloc_alloc_template<inst>::oom_realloc(void *p, size_t) {
void (* my_malloc_handler) ();
void * result;
for (;;) {
my_malloc_handler = __malloc_alloc_oom_handler;
if (0 == my_malloc_handler) {__THROW_BAD_ALLOC;}
(*my_malloc_handler) ();
result = realloc(p, n);
if (result) return result;
}
}
typedef __malloc_alloc_template<0> malloc_alloc;
//第二级配置器
template <bool threads, int inst>
class __default_alloc_template {
private:
//bytes上调至8的倍数
static size_t ROUND_UP(size_t bytes) {
return ( (bytes + ALIGN -1) & ~(ALIGN - 1));
}
private:
union obj {
union obj * free_list_link;
};
private:
static obj * free_list[NFREELISTS];
static size_t FREELIST_INDEX(size_t bytes) {
return ( (bytes + ALIGN -1)/ALIGN -1);
}
//当freelist中没有大小为n个块,调用此函数,会返回从内存池中返回若干个块,将其中的一个返回,将剩余的放入freelist中
static void *refill(size_t n);
//从内存池中分配一大块空间,大小为nobjs个大小为 size的块,如果内存不足,nobjs会减小
static char *chunk_alloc(size_t size, int &nobjs);
static char *start_free;//内存池起始位置
static char *end_free;//内存池结束位置
static size_t heap_size;//一个不太重要的变量
public:
static void * allocate(size_t n) {
obj ** my_free_list;
obj * result;
if (n > MAX_BYTES) return (malloc_alloc::allocate(n));
my_free_list = free_list + FREELIST_INDEX(n);
result = *my_free_list;
if (result == 0) {
void *r = refill(ROUND_UP(n));
return r;
}
*my_free_list = result->free_list_link;
return result;
}
static void deallocate(void *p, size_t n) {
obj * q = (obj *) p;
obj ** my_free_list;
if (n >MAX_BYTES) {//对于大块就free,对于小块是要回收到freelist中,以备再次使用
malloc_alloc::deallocate(p,n);
return;
}
my_free_list = free_list + FREELIST_INDEX(n);
q->free_list_link = *my_free_list;
my_free_list->free_list_link = q;
}
static void * reallocate(void *p, size_t old_sz, size_t new_sz) {
void * result;
size_t copy_sz;
if (old_sz > MAX_BYTES && new_sz > MAX_BYTES) {
return (malloc_alloc::reallocate(p,old_sz, new_sz));
}
if (ROUND_UP(old_sz) == ROUND_UP(new_sz)) return p;
result = allocate(new_sz);
copy_sz = new_sz > old_sz ? old_sz : new_sz;
memcpy(result, p , copy_sz);
deallocate(p, old_sz);
return result;
}
};
template<bool threads, int inst>
void * __default_alloc_template<threads,inst>::refill(size_t n) {
int nobjs = 20;
char *chunk = chunk_alloc(n, nobjs);
obj ** my_free_list;
obj * result;
obj * current_obj, * next_obj;
int i;
if (1 == nobjs) return chunk;
my_free_list = free_list + FREELIST_INDEX(n);
result = (obj *)chunk;
*my_free_list = next_obj = (obj *)(chunk + n);
for (int i = 1;; ++i) {
current_obj = next_obj;
next_obj = (obj *)((char *)next_obj + n);
if (i == nobjs - 1) {
current_obj->free_list_link = NULL;
break;
}
current_obj->free_list_link = next_obj;
}
return result;
}
template<bool threads, int inst>
char *__default_alloc_template<threads, inst>::chunk_alloc(size_t size, int &nobjs) {
char * result;
size_t total_bytes = size * nobjs;
size_t bytes_left = end_free - start_free;
if (bytes_left >= total_bytes) {
result = start_free;
start_free += total_bytes;
return result;
}
else if (bytes_left >= size){//至少能提供一个块
result = start_free;
nobjs = bytes_left / size;
total_bytes = size * nobjs;
start_free += total_bytes;
return result;
}
else {
size_t bytes_to_get = 2 * total_bytes +ROUND_UP(heap_size >> 4);//ROUND_UP(heap_size >> 4)作用不大
if (bytes_left >0) {
obj ** my_free_list = free_list + FREELIST_INDEX(bytes_left);
((obj *)start_free)->free_list_link = *my_free_list;
*my_free_list = (obj *)start_free;
}
start_free = (char *)malloc(bytes_to_get);
if (0 == start_free) {//没有多余内存,需要从freelist中找到块
int i;
obj ** my_free_list, *p;
for (i = size; i < MAX_BYTES; i += ALIGN) {
my_free_list = free_list + FREELIST_INDEX(i);
p = *my_free_list;
if (0 != p) {
*my_free_list = p->free_list_link;
start_free = (char *)p;
end_free = start_free + i;
return chunk_alloc(size,nobjs);
}
}
end_free = 0;
start_free = (char *)malloc_alloc::allocate(bytes_to_get);
heap_size += bytes_to_get;
end_free = start_free + bytes_to_get;
return chunk_alloc(size, nobjs);
}
}
}
template<bool threads, int inst>
char *__default_alloc_template<threads, inst>::start_free = 0;
template<bool threads, int inst>
char *__default_alloc_template<threads, inst>::end_free = 0;
template<bool threads, int inst>
size_t __default_alloc_template<threads, inst>::heap_size = 0;
//注意一定要有typename告诉编译器,这个模板类肯定有这个类型obj
template<bool threads, int inst>
typename __default_alloc_template<threads, inst>::obj *
__default_alloc_template<threads, inst>::free_list[NFREELISTS] =
{0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, };
typedef __default_alloc_template<false, 0> alloc;
template<class T, class Alloc>
class simple_alloc {
public:
//返回n个T大小的内存
static T *allocate(size_t n) {
return 0 == N ? 0 : (T *) Alloc::allocate(N * sizeof(T));
}
static T *allocate() {
return (T *) Alloc::allocate(sizeof(T));
}
static void deallocate(T *p, size_t n) {
if (0 != n) {
Alloc::deallocate(p, n * sizeof(T));
}
}
static void deallocate(T *p) {
Alloc::deallocate(p, sizeof(T));
}
};
#endif
之下开始研究vector
参考:http://blog.youkuaiyun.com/yangzhongxuan/article/details/8017629