垃圾回收 -- 复制算法

最新推荐文章于 2025-10-22 23:09:17 发布

原创

最新推荐文章于 2025-10-22 23:09:17 发布 · 939 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#gc #垃圾回收 #复制

GC复制算法通过From和To空间进行对象复制，避免碎片化，提高吞吐量。当From空间满时，活动对象复制到To空间，然后互换角色。复制过程中使用COPIED标识避免重复复制，使用深度优先搜索。然而，算法导致堆利用率低且不兼容保守式GC。Cheney算法通过迭代和forwarding指针改进，但牺牲了缓存效率。近似深度优先搜索和多空间复制算法进一步优化，提高堆利用率，结合标记-清除算法减少分配时间。

GC 复制算法

GC 复制算法是利用From 空间进行分配的。当From 空间被完全占满时，GC 会将活动
对象全部复制到To 空间。当复制完成后，该算法会把From 空间和To 空间互换，GC 也就结
束了。From 空间和To 空间大小必须一致。这是为了保证能把From 空间中的所有活动对象
都收纳到To 空间里

copying(){
	$free = $to_start
	for(r : $roots)
		*r = copy(*r)
	swap($from_start, $to_start)
}

在GC 结束时，原空间的对象会作为垃圾被回收。因此，由根指向原空间对象的指针也会被重写成指向返回值的新对象的指针

在复制过程中，需要识别已经被复制的对象，这个是通过标识 obj.tag = COPIED 实现，当GC扫描到该对象时，发现已经被复制，就会跳过该对象，这样有多个指向该obj的指针也就不会被复制多次

在这里插入图片描述

copy() 函数会返回指向新空间的指针，所以会把指向子对象的引用重写为这个新
的指针。这样一来，从To 空间指向From 空间的指针就全部指向To 空间

注意GC 完成后只有1 个分块的内存空间。在每次分配时，只要把所申请大小的内存空间从这个分块中分割出来给mutator 就行了. 意思就是GC复制算法每次都是从空闲的块起始位置开始分配的，即使之前分配的对象已经不再被使用，失效了， mutator分配内存的时候也会从上次内存分配的结束位置开始进行分配，如果发现内存不足，那么就会启动回收机制，进行从from空间到to空间的整理

在复制算法搜索活动对象的时候，使用的深度优先搜索

特点：

优秀的吞吐量

GC 标记- 清除算法消耗的吞吐量是搜索活动对象（标记阶段）所花费的时间和搜索整体堆（清除阶段）所花费的时间之和，GC 复制算法只搜索并复制活动对象，跟一般的GC 标记- 清除算法相比，它能在较短时间内完成GC

可实现高速分配

GC 复制算法不使用空闲链表。这是因为分块是一个连续的内存空间，只要这个分块大小不小于所申请的大小，那么移动$free 指针就可以进行分配

不会发生碎片化

因为每次分配都是从堆得一端依次开始进行分配，不会存在中间分块的内存碎片

与缓存兼容

GC 复制算法中有引用关系的对象会被安排在堆里离彼此较近的位置

堆得使用率低下

因为需要将堆分配为两块大小一样的内存空间，只有一块空间会在同一时间被使用

不兼容保守式GC 算法因为需要移动对象
递归调用函数

复制某个对象时要递归复制它的子对象，比起这种递归算法，迭代算
法更能高速地执行

改进：

Cheney 的GC复制算法

迭代地进行复制，使用的是广度优先搜索

Cheney 的GC 复制算法中使用的是forwarding 指针，而不是之前obj.tag设置为

COPIED进行判断，该对象是否已经被复制。原因是，如果对象已经被复制，那么它的子对象指向的是to空间的地址，而如果还没有被复制，指向的是原来的from空间地址

广度优先搜索需要先入先出（FIFO）结构的队列，即把该搜索的对象保持在队列中，一边取出一边进行搜索。

可以抑制调用函数的额外负担和栈的消耗，但是由于使用了广度优先算法，因此对于缓存的使用优势没有兼容

近似深度优先搜索方法

方法是将堆分割成一个个页面的数组，然后将相邻引用的对象放入对应的页面中

这样就可以将对象缓存在相邻位置

在这里插入图片描述

算法采用的不是完整的广度优先搜索，而是在每个页面上分别进行广度优先搜索。

多空间复制算法

GC 复制算法最大的缺点是只能利用半个堆

如果将堆分成10 份，其中需要拿出2 块空间分别作为From 空间和To 空间来执行GC 复制算法。必须空出1 块空间来当To 空间，这样浪费率差不多就是1/10了

对于剩余空间的管理，可以使用其他方法进行，比如标记清除算法

多空间复制算法简短得说就是把堆N 等分，对其中2 块空间执行GC 复制算法，对剩下的（N-2）块空间执行GC 标记- 清除算法，也就是把这2 种算法组合起来

过程：

multi_space_copying(){
	$free = $heap[$to_space_index]
	for(r : $roots)
		*r = mark_or_copy(*r)
	for(index : 0..(N-1))
		if(is_copying_index(index) == FALSE