Buffer（缓冲器）

原创已于 2025-10-21 11:20:21 修改 · 1k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#node.js #前端 #javascript

于 2024-02-13 08:00:00 首次发布

Node.js 专栏收录该内容

9 篇文章

订阅专栏

文章目录

一、Buffer 是什么？：不止是 “字节数组”
- 1.1 设计初衷：为什么需要 Buffer？
- 1.2 内存模型：Buffer 与 V8 的关系
二、Buffer 的核心特点：理解它的 “与众不同”
三、Buffer 核心用法：从创建到实战操作
四、Buffer 实际应用场景：从理论到落地
五、常见问题与解决方案：避坑指南
六、Buffer 性能优化建议
总结

一、Buffer 是什么？：不止是 “字节数组”

Buffer 是 Node.js 核心 API 提供的二进制数据处理对象，本质是操作系统堆外内存块的抽象封装—— 它不占用 V8 引擎的堆内存，而是直接对接底层系统内存，专门解决 JavaScript 原生无法高效处理二进制数据的问题（如文件 IO、网络传输、硬件交互等场景）。

1.1 设计初衷：为什么需要 Buffer？

JavaScript 最初为浏览器设计，仅擅长处理字符串和结构化数据，对二进制流（如图片字节、TCP 数据包）的处理能力薄弱。而 Node.js 作为服务端运行时，需要频繁与文件系统、网络协议交互，因此引入 Buffer：

跳过 V8 堆内存分配，直接使用系统内存，减少垃圾回收（GC）压力
提供统一的二进制操作接口，避免不同场景下的类型转换开销

1.2 内存模型：Buffer 与 V8 的关系

分配位置：Buffer 内存由 Node.js 的 libuv 库在操作系统堆外分配，不属于 V8 堆内存
引用方式：Buffer 对象本身（包含内存地址、长度等元信息）存储在 V8 堆中，但实际数据在堆外
优势：堆外内存不受 V8 GC 管理，适合存储大体积、长期存在的二进制数据（如大文件流），避免 GC 频繁扫描导致的性能波动

二、Buffer 的核心特点：理解它的 “与众不同”

2.1 大小固定且不可动态调整

一旦通过 alloc/allocUnsafe/from 创建 Buffer，其长度（字节数）就固定不变 —— 因为它对应一块连续的系统内存，无法像数组一样 “动态扩容”
若需修改长度，只能重新创建新 Buffer 并复制数据（如 Buffer.concat 合并多个 Buffer）

// 错误：无法直接修改 length
const buf = Buffer.alloc(5);
buf.length = 10; // 无效，buf.length 仍为 5

// 正确：通过 concat 间接“扩容”
const newBuf = Buffer.concat([buf, Buffer.alloc(5)]);
console.log(newBuf.length); // 10

2.2 性能优先：直接操作底层内存

避免 JavaScript 类型转换：Buffer 存储的是无符号 8 位整数（0-255），直接映射底层字节，无需像数组一样处理复杂类型
堆外内存优势：大体积 Buffer 不占用 V8 堆空间，减少 GC 触发频率（尤其在处理大文件、高并发网络流时）

2.3 字节级存储：每个元素固定 1 字节

Buffer 本质是 “字节数组”，每个索引对应 1 个字节（8 位二进制），取值范围 0-255（超出会被截断，如 300 → 300 - 256 = 44）
注意：字符≠字节——UTF-8 编码下，英文字符占 1 字节，中文占 3 字节， emoji 可能占 4 字节

const str = "你好a😀";
const buf = Buffer.from(str);
console.log(str.length); // 4（字符数）
console.log(buf.length); // 3+3+1+4=11（字节数）

三、Buffer 核心用法：从创建到实战操作

3.1 创建 Buffer：3 种方式的差异与场景

（1）Buffer.alloc：安全初始化（推荐敏感场景）

特点：分配指定长度的 Buffer，并将所有字节初始化为 0，避免残留旧内存数据
扩展参数：支持填充指定内容和编码（alloc(长度, 填充内容, 编码)）

// 基础用法：10 字节全为 0
const buf1 = Buffer.alloc(10);
console.log(buf1); // <Buffer 00 00 00 00 00 00 00 00 00 00>

// 扩展用法：5 字节填充 'x'（UTF-8 编码）
const buf2 = Buffer.alloc(5, "x", "utf8");
console.log(buf2); // <Buffer 78 78 78 78 78>（78 是 'x' 的 ASCII 码）

适用场景：存储密码、令牌等敏感数据，避免旧内存数据泄露

（2）Buffer.allocUnsafe：高性能未初始化（非敏感场景）

特点：仅分配内存，不初始化字节（可能残留之前的内存数据），因此性能比 alloc 高，但存在安全风险

const buf3 = Buffer.allocUnsafe(10);
console.log(buf3); // 可能输出 <Buffer a3 2f 00 ...>（随机旧数据）

适用场景：非敏感的临时二进制数据（如文件分片、网络数据包缓存），需快速分配内存时

（3）Buffer.from：从已有数据创建（最常用）

支持从字符串、数组、另一个 Buffer 或 ArrayBuffer 创建，自动处理数据转换：

// 1. 从字符串创建（默认 UTF-8，可指定编码）
const buf4 = Buffer.from('hello', 'utf8');
console.log(buf4); // <Buffer 68 65 6c 6c 6f>

// 2. 从数组创建（数组元素需为 0-255 的整数）
const buf5 = Buffer.from([104, 101, 108, 108, 111]); // 对应 'hello' 的 ASCII 码
console.log(buf5.toString()); // 'hello'

// 3. 从另一个 Buffer 复制（深拷贝，修改新 Buffer 不影响原 Buffer）
const buf6 = Buffer.from(buf4);
buf6[0] = 65; // 65 是 'A' 的 ASCII 码
console.log(buf4); // <Buffer 68 65 6c 6c 6f>（原 Buffer 不变）
console.log(buf6); // <Buffer 41 65 6c 6c 6f>（新 Buffer 已修改）

// 4. 从 ArrayBuffer 创建（共享内存，适合与其他二进制 API 协作）
const ab = new ArrayBuffer(4);
const buf7 = Buffer.from(ab);
buf7[0] = 255;
console.log(new Uint8Array(ab)[0]); // 255（共享内存，ArrayBuffer 也被修改）

3.2 Buffer 与字符串互转：编码是关键

Buffer 转字符串用 toString()，字符串转 Buffer 用 Buffer.from()，核心是确保编码一致，否则会出现乱码。

（1）常用编码格式

编码	适用场景	特点
utf8	默认编码，通用文本	可变长度（1-4 字节 / 字符）
ascii	纯英文文本	仅支持 0-127 字符，超出截断
base64	二进制数据转文本（如图片）	编码后体积增大 1/3，便于传输
hex	二进制数据可视化（如哈希）	每个字节转 2 个十六进制字符

（2）实战示例

// 1. 指定编码转字符串
const buf8 = Buffer.from('你好', 'utf8');
console.log(buf8.toString('utf8')); // '你好'（正确，编码一致）
console.log(buf8.toString('ascii')); // '??'（错误，ASCII 不支持中文）

// 2. 截取部分转换（start 起始索引，end 结束索引，左闭右开）
const buf9 = Buffer.from('hello world');
console.log(buf9.toString('utf8', 0, 5)); // 'hello'（截取前 5 字节）

// 3. 处理特殊编码（如 GBK）
// Node.js 默认不支持 GBK，需借助第三方库 iconv-lite
const iconv = require('iconv-lite');
const gbkBuf = iconv.encode('你好', 'gbk'); // GBK 编码的 Buffer（长度 4）
const gbkStr = iconv.decode(gbkBuf, 'gbk'); // 解码为 GBK 字符串
console.log(gbkStr); // '你好'

3.3 Buffer 读写：字节级操作细节

通过 [] 直接读写单个字节，需注意字节范围和多字节字符的特殊性。

（1）读取字节

读取结果为 无符号 8 位整数（0-255），若索引超出范围，返回 undefined
多字节字符（如中文）无法通过单个索引读取完整字符（需结合编码截取连续字节）

const buf10 = Buffer.from('你好'); // UTF-8 编码，长度 6（3 字节/中文）
console.log(buf10[0]); // 228（仅“你”的第一个字节，非完整字符）
console.log(buf10[3]); // 229（“好”的第一个字节）

（2）修改字节

赋值超出 0-255：自动截断为 8 位二进制（如 300 → 300 & 255 = 44）
赋值为字符串：取第一个字符的 UTF-8 编码第一个字节（如 'A' → 65）
赋值为负数：自动转为正数（如 -1 → 255，-2 → 254）

const buf11 = Buffer.from("hello");

// 1. 正常修改
buf11[1] = 65; // 65 是 'A' 的 ASCII 码
console.log(buf11.toString()); // 'hAllo'

// 2. 超出 255 截断
buf11[2] = 300;
console.log(buf11[2]); // 44（300 - 256 = 44）
console.log(buf11.toString()); // 'hAlo'（44 对应特殊字符，显示异常）

// 3. 赋值字符串
buf11[3] = "z";
console.log(buf11[3]); // 122（'z' 的 ASCII 码）
console.log(buf11.toString()); // 'hAlzo'

3.4 Buffer 常用工具方法

除了基础操作，Buffer 还提供多个实用方法，覆盖合并、截取、填充等场景：

方法	功能描述	示例
Buffer.concat([buf1, buf2], len)	合并多个 Buffer，len 可选（总长度）	`Buffer.concat([buf1, buf2])`
buf.slice(start, end)	截取 Buffer（返回视图，非复制）	`buf.slice(1, 3)`（索引 1-2，左闭右开）
buf.fill(val, start, end)	填充 Buffer，val 为填充值	`buf.fill('x', 2, 5)`
buf.indexOf(val, pos)	查找 val 在 Buffer 中的索引，pos 起始位置	`buf.indexOf('l')`
buf.equals(otherBuf)	比较两个 Buffer 是否完全相等	`buf1.equals(buf2)` → true/false

关键注意点：slice 是 “视图” 不是 “复制”

buf.slice() 返回的是原 Buffer 的内存视图，修改切片会影响原 Buffer；若需独立切片，需用 Buffer.from(buf.slice()) 复制：

const buf12 = Buffer.from("hello world");

const slice1 = buf12.slice(0, 5); // 视图，共享内存
slice1[0] = 65; // 修改切片
console.log(buf12.toString()); // 'Aello world'（原 Buffer 被修改）

const slice2 = Buffer.from(buf12.slice(0, 5)); // 复制，独立内存
slice2[0] = 104; // 修改复制后的切片
console.log(buf12.toString()); // 'Aello world'（原 Buffer 不变）

四、Buffer 实际应用场景：从理论到落地

Buffer 是 Node.js 处理二进制数据的基石，以下是高频应用场景：

4.1 文件 IO：读写二进制文件

Node.js 的 fs 模块读写文件时，默认返回 / 接收 Buffer（而非字符串），尤其适合处理图片、视频、压缩包等二进制文件：

const fs = require("fs");
const path = require("path");

// 1. 读取图片文件（Buffer 形式）
fs.readFile(path.join(__dirname, "test.png"), (err, data) => {
  if (err) throw err;
  console.log(data instanceof Buffer); // true（data 是 Buffer）

  // 2. 写入文件（直接传 Buffer）
  fs.writeFile(path.join(__dirname, "copy.png"), data, (err) => {
    if (err) throw err;
    console.log("图片复制完成");
  });
});

// 大文件优化：用流（Stream）分块处理 Buffer，避免内存溢出
const readStream = fs.createReadStream("large-file.mp4");
const writeStream = fs.createWriteStream("large-file-copy.mp4");

readStream.on("data", (chunk) => {
  console.log("接收分块：", chunk.length); // chunk 是 Buffer
  writeStream.write(chunk);
});

readStream.on("end", () => {
  writeStream.end();
  console.log("大文件复制完成");
});

4.2 网络传输：处理 TCP/HTTP 二进制流

TCP 协议：Node.js 的 net 模块接收的数据包是 Buffer，需拼接分块数据：

const net = require("net");

const server = net.createServer((socket) => {
  let chunks = [];

  socket.on("data", (chunk) => {
    chunks.push(chunk); // chunk 是 Buffer，收集分块
  });

  socket.on("end", () => {
    const fullData = Buffer.concat(chunks); // 合并所有分块

    console.log("接收完整数据：", fullData.toString());
  });
});

server.listen(3000);

HTTP 协议：请求体（req）和响应体（res）默认以 Buffer 传输，尤其处理文件上传时：

const http = require("http");

const server = http.createServer((req, res) => {
  if (req.method === "POST") {
    let body = [];

    req.on("data", (chunk) => {
      body.push(chunk); // 收集请求体分块（Buffer）
    });

    req.on("end", () => {
      const bodyBuffer = Buffer.concat(body);

      res.end(`接收数据长度：${bodyBuffer.length} 字节`);
    });
  } else {
    res.end("Hello World");
  }
});

server.listen(3000);

4.3 二进制数据处理：解析与生成

解析二进制格式：如解析图片头部信息（判断图片类型）、自定义二进制协议：

// 解析图片类型：通过 Buffer 前几个字节判断（文件签名）
function getImageType(buf) {
  const signatures = {
    ffd8ffe0: "jpg", // JPG 签名：前 4 字节
    "89504e47": "png", // PNG 签名：前 4 字节
    47494638: "gif", // GIF 签名：前 4 字节
  };

  const hex = buf.slice(0, 4).toString("hex"); // 转 16 进制

  return signatures[hex] || "unknown";
}

const imgBuf = fs.readFileSync("test.png");

console.log(getImageType(imgBuf)); // 'png'

生成二进制数据：如生成自定义格式的二进制文件、加密数据（crypto 模块返回 Buffer）：

const crypto = require("crypto");

// 生成 MD5 哈希（返回 Buffer）
const hash = crypto.createHash("md5").update("hello").digest();

console.log(hash instanceof Buffer); // true
console.log(hash.toString("hex")); // '5d41402abc4b2a76b9719d911017c592'（哈希字符串）

五、常见问题与解决方案：避坑指南

5.1 乱码问题：编码不匹配

现象：Buffer 转字符串后出现 ?? 或乱码字符
原因：创建 Buffer 与转换字符串时使用的编码不一致（如 GBK 字符串用 UTF-8 解码）
解决方案：

// 错误示例：编码不匹配
const gbkStr = "你好";
const buf = Buffer.from(gbkStr, "utf8"); // 用 UTF-8 编码
const wrongStr = iconv.decode(buf, "gbk"); // 用 GBK 解码 → 乱码

// 正确示例：编码一致
const rightBuf = iconv.encode(gbkStr, "gbk"); // 用 GBK 编码
const rightStr = iconv.decode(rightBuf, "gbk"); // 用 GBK 解码 → '你好'

明确指定编码，确保 “创建” 和 “解码” 编码一致
处理非 UTF-8 编码（如 GBK、GB2312）时，使用 iconv-lite 库

5.2 内存安全：allocUnsafe 的风险

现象：使用 allocUnsafe 创建的 Buffer 包含敏感数据（如之前内存中的密码）
原因：allocUnsafe 不初始化内存，直接复用系统空闲内存，可能残留旧数据
解决方案：

// 安全处理 allocUnsafe 创建的 Buffer
const unsafeBuf = Buffer.allocUnsafe(10);
unsafeBuf.fill(0); // 手动初始化，清除旧数据
unsafeBuf.write("password123"); // 再存储敏感数据

存储敏感数据时，优先使用 Buffer.alloc（自动初始化）
若用 allocUnsafe，需手动初始化（如 buf.fill(0)）后再使用

5.3 长度混淆：Buffer.length vs 字符串.length

现象：认为 buf.length 等于字符串的字符数，导致截取数据错误
原因：buf.length 是字节数，str.length 是字符数，UTF-8 下多字节字符会导致两者不一致
解决方案：

const { StringDecoder } = require("string_decoder");
const decoder = new StringDecoder("utf8");
const str = "你好世界";
const buf = Buffer.from(str); // 字节长度 12（3*4）

// 错误：直接截取 Buffer 导致字符断裂
const wrongSlice = buf.slice(0, 4);
console.log(wrongSlice.toString()); // '你�'（“你”的 3 字节 + “好”的 1 字节，断裂）

// 正确：用 StringDecoder 处理边界
const rightSlice = buf.slice(0, 4);
console.log(decoder.write(rightSlice)); // '你'（自动保留未完成的字节，等待后续数据）

截取字符串时，先转字符串再截取，而非直接截取 Buffer
需按字节截取时，借助 string_decoder 库处理多字节字符边界

六、Buffer 性能优化建议

6.1 优先选择合适的创建方式

敏感数据 / 需安全初始化：用 Buffer.alloc
非敏感数据 / 追求性能：用 Buffer.allocUnsafe（需手动初始化非敏感场景）
从已有数据创建：用 Buffer.from（避免额外内存分配）

6.2 合并 Buffer 时指定总长度

Buffer.concat 若不指定总长度，会先遍历所有 Buffer 计算长度，再分配内存；指定总长度可减少一次遍历，提升性能：

const bufA = Buffer.alloc(100);
const bufB = Buffer.alloc(200);

// 优化前：需遍历计算总长度（100+200）
const concat1 = Buffer.concat([bufA, bufB]);

// 优化后：直接指定总长度，减少计算
const concat2 = Buffer.concat([bufA, bufB], 300);

6.3 复用 Buffer 减少内存分配

频繁创建小 Buffer 会导致内存碎片，可复用已创建的 Buffer（如用 buf.fill(0) 清空后重新写入）：

// 不推荐：频繁创建新 Buffer
for (let i = 0; i < 1000; i++) {
  const buf = Buffer.from(`data-${i}`);

  // 处理 buf...
}

// 推荐：复用单个 Buffer
const reuseBuf = Buffer.alloc(20); // 预分配足够长度的 Buffer

for (let i = 0; i < 1000; i++) {
  reuseBuf.fill(0); // 清空旧数据
  reuseBuf.write(`data-${i}`); // 写入新数据

  // 处理 reuseBuf...
}

6.4 避免不必要的 Buffer 转字符串

Buffer 转字符串会产生额外的内存开销，若仅需判断数据（如是否包含某个字节），直接操作 Buffer 即可：

// 不推荐：先转字符串再判断
const buf = Buffer.from("hello");

if (buf.toString().includes("h")) {
  /\* ... \*/;
}

// 推荐：直接用 Buffer 的 indexOf 判断
if (buf.indexOf("h") !== -1) {
  /\* ... \*/;
}