JavaScript垃圾回收机制：从内存管理到性能哲学

学习机器不会机器学习

于 2025-02-28 08:30:00 发布

阅读量858

点赞数 9

文章标签： javascript 开发语言前端

本文链接：https://blog.youkuaiyun.com/weixin_55862073/article/details/145916182

版权

一、三种垃圾回收算法的深入解析

在JavaScript内存管理领域，存在三种经典策略的博弈与演进。

1、标记清除（Mark-and-Sweep）

算法核心：通过可达性分析确定存活对象

实现过程：

根对象标记：从全局对象、活动函数调用栈等GC Roots出发
追踪标记：深度优先遍历所有可达对象
清除阶段：回收未被标记的内存块

// 伪代码实现
function markAndSweep() {
    // 标记阶段
    let worklist = [...roots];
    while (worklist.length > 0) {
        const obj = worklist.pop();
        if (!obj.marked) {
            obj.marked = true;
            worklist.push(...obj.references);
        }
    }

    // 清除阶段
    for (const obj of heap) {
        if (!obj.marked) {
            freeMemory(obj);
        } else {
            obj.marked = false; // 重置标记位
        }
    }
}

优势：

完美解决循环引用问题
适合处理大规模内存
内存利用率较高

缺陷：

产生内存碎片（可通过标记-整理优化）
全堆扫描导致STW停顿

2、引用计数（Reference Counting）

算法核心：通过指针计数器管理对象生命周期

关键机制：

// 伪引用计数器
class RefCountedObject {
    constructor() {
        this.count = 1; // 初始引用
        this.references = new Set();
    }

    addRef() {
        this.count++;
    }

    release() {
        if (--this.count === 0) {
            this._destroy();
        }
    }

    _destroy() {
        this.references.forEach(obj => obj.release());
        freeMemory(this);
    }
}

致命缺陷：

// 循环引用陷阱
function createCycle() {
    let objA = new RefCountedObject();
    let objB = new RefCountedObject();
    
    objA.ref = objB;  // objB.count = 2
    objB.ref = objA;  // objA.count = 2
}

createCycle(); 
// 函数执行后：objA.count = 1, objB.count = 1 → 内存泄漏

现代应用：

仍用于特定场景（如COM组件）
WeakRef等新型API的基础
与标记清除配合使用

3、分代回收（Generational Collection）

理论基础：弱分代假说（年轻对象更易消亡）

分代策略对比：

同时V8有一种对象晋升机制，简而言之，就是如果新生代的对象几次清除后都存在于内存中，就会晋升为老生代对象。

V8具体实现：

// 新生代内存布局（Semispace）
class NewSpace {
    constructor() {
        this.fromSpace = new ArrayBuffer(4 * 1024 * 1024); // 4MB
        this.toSpace = new ArrayBuffer(4 * 1024 * 1024);
        this.allocPtr = 0;
    }

    allocate(size) {
        if (this.allocPtr + size > this.fromSpace.byteLength) {
            this.doScavenge();
        }
        const ptr = this.allocPtr;
        this.allocPtr += size;
        return ptr;
    }

    doScavenge() {
        // Cheney算法复制存活对象
        let scanPtr = 0;
        this.allocPtr = 0;
        
        while (scanPtr < this.allocPtr) {
            const obj = this.toSpace[scanPtr];
            for (const ref of obj.references) {
                if (ref.isInFromSpace()) {
                    copyToNewSpace(ref);
                }
            }
            scanPtr += obj.size;
        }
        [this.fromSpace, this.toSpace] = [this.toSpace, this.fromSpace];
    }
}

二、现代GC算法演进 -分代回收算法的不同策略

2.1 新生代Scavenge算法

采用Cheney算法实现的复制式回收，通过From和To空间的交替实现快速回收：

// 伪代码实现
function scavenge() {
    let from = currentNewSpace;
    let to = newNewSpace;
    
    for (let obj of reachableObjects) {
        copyObject(obj, to);
        forwardPointer(obj, to);
    }
    
    swapSpaces(from, to);
}

2.2 老生代标记-清除优化

V8采用三色标记法与增量标记结合：

白色：未访问对象
灰色：访问中对象
黑色：已访问对象

// 增量标记示例
function incrementalMarking() {
    let worklist = getGreyObjects();
 
    while (worklist.length > 0 && !shouldYield()) {
        const obj = worklist.pop();
        markObject(obj);
        for (const ref of getReferences(obj)) {
            if (!isMarked(ref)) {
                markGrey(ref);
                worklist.push(ref);
            }
        }
    }
    
    if (worklist.length > 0) {
        requestIdleCallback(incrementalMarking);
    }
}

需要额外补充一点的就是，由于js是单线程的，垃圾清除和执行js只能在同一线程运行，所以垃圾回收可能会影响运行性能，所以V8采用了增量标记，将标记拆分成多个子进程，和运行js任务交替进行，避免脚本长时间等待。

三、内存泄漏的现代形态

3.1 闭包陷阱

function createClosureLeak() {
    const hugeData = new Array(1e6).fill('*');
    return function() {
        // 闭包意外持有hugeData
        console.log('Closure executed');
    };
}

let leakedClosure = createClosureLeak();

3.2 现代框架中的引用残留

React组件示例：



function Component() {
    const [data, setData] = useState(null);
    
    useEffect(() => {
        const timer = setInterval(() => {
            fetchData().then(result => {
                setData(result); // 可能持有旧引用
            });
        }, 1000);
        
        return () => clearInterval(timer);
    }, []); // 缺少依赖项导致闭包持有旧state
}

四、GC性能优化策略

4.1 对象池技术

class VectorPool {
    constructor() {
        this.pool = [];
    }

    create(x, y) {
        return this.pool.pop() || { x, y };
    }

    release(vec) {
        vec.x = null;
        vec.y = null;
        this.pool.push(vec);
    }
}

// 使用示例
const pool = new VectorPool();
const v1 = pool.create(10, 20);
// ...使用后
pool.release(v1);

4.2 内存访问模式优化

// 不良访问模式
function processMatrix(matrix) {
    for (let col = 0; col < 1000; col++) {
        for (let row = 0; row < 1000; row++) {
            process(matrix[row][col]); // 破坏内存连续性
        }
    }
}

// 优化后的访问模式
function optimizedProcess(matrix) {
    for (let row = 0; row < 1000; row++) {
        const rowData = matrix[row];
        for (let col = 0; col < 1000; col++) {
            process(rowData[col]); // 顺序访问
        }
    }
}

开发者需要在自动化的GC机制与精准的内存控制之间寻找平衡。理解GC不仅是为了避免内存泄漏，更是为了构建高性能的Web应用。

正如计算机科学家Edsger Dijkstra所言："内存管理不是程序的附属品，而是编程本质的体现。"在自动回收与手动控制之间，我们始终在探索更优雅的解决方案。