MemoryStream 的GetBuffer() 和 ToArray()的区别

最新推荐文章于 2025-03-25 22:00:00 发布

原创最新推荐文章于 2025-03-25 22:00:00 发布 · 1w 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#byte #string #stream #buffer

本文介绍了一个GZip数据压缩过程中的优化技巧，通过使用MemoryStream的ToArray方法替代GetBuffer方法，有效减少了压缩后的字节数组中包含的多余零字节，从而实现了更高效的压缩效果。

近日在开发压缩数据程序的过程中，有一段代码：

public List<string> CompressString(string xmlStr)
        {
            byte[] bytes = Encoding.Default.GetBytes(xmlStr);
            MemoryStream ms = new MemoryStream();

            GZipStream gzip = new GZipStream(ms, CompressionMode.Compress);
            gzip.Write(bytes, 0, bytes.Length);
            gzip.Flush();
            gzip.Close();
            byte[] gzipBytes = ms.GetBuffer();
            ms.Close();

            string hexStr = byteArrayToHexString(gzipBytes);
            return SplitString(hexStr);
        }

其中 gzipBytes 后面总是有很多 0 的字节。而且 gzipBytes 的大小也远远大于预期的值。

查了 MSDN 后知道， GetBuffer 是把 stream 中的 buffer 的引用传递出来， buffer 的大小是由 stream的 Capacity来决定的。因为只是地址的引用传递，所以 GetBuffer() 速度很快，但是却把很多没用到的空数据做占用的地址空间也传递出来了。

ToArray() 是将 MemoryStream的数据复制到一个 byte[] 中，因此速度要比 GetBuffer() 慢，但是它不会将无用的空数据放在 byte[] 中，所以在这里，考虑到后者是我们所关注的焦点，把代码改为：

public List<string> CompressString(string xmlStr)
        {
            byte[] bytes = Encoding.Default.GetBytes(xmlStr);
            MemoryStream ms = new MemoryStream();

            GZipStream gzip = new GZipStream(ms, CompressionMode.Compress);
            gzip.Write(bytes, 0, bytes.Length);
            gzip.Flush();
            gzip.Close();
            byte[] gzipBytes = ms.ToArray();
            ms.Close();

            string hexStr = byteArrayToHexString(gzipBytes);
            return SplitString(hexStr);
        }