近日在开发压缩数据程序的过程中,有一段代码:
public List<string> CompressString(string xmlStr)
{
byte[] bytes = Encoding.Default.GetBytes(xmlStr);
MemoryStream ms = new MemoryStream();
GZipStream gzip = new GZipStream(ms, CompressionMode.Compress);
gzip.Write(bytes, 0, bytes.Length);
gzip.Flush();
gzip.Close();
byte[] gzipBytes = ms.GetBuffer();
ms.Close();
string hexStr = byteArrayToHexString(gzipBytes);
return SplitString(hexStr);
}
其中 gzipBytes 后面总是有很多 0 的字节。 而且 gzipBytes 的大小也远远 大于 预期的值。
查了 MSDN 后知道, GetBuffer 是把 stream 中的 buffer 的引用传递出来, buffer 的大小是由 stream的 Capacity来决定的。 因为只是地址的引用传递,所以 GetBuffer() 速度很快,但是却把 很多没用到的 空数据做占用的地址空间也传递出来了。
ToArray() 是 将 MemoryStream的 数据复制到一个 byte[] 中,因此速度要比 GetBuffer() 慢,但是它不会将无用的空数据放在 byte[] 中,所以在这里,考虑到后者是我们所关注的焦点,把代码改为:
public List<string> CompressString(string xmlStr)
{
byte[] bytes = Encoding.Default.GetBytes(xmlStr);
MemoryStream ms = new MemoryStream();
GZipStream gzip = new GZipStream(ms, CompressionMode.Compress);
gzip.Write(bytes, 0, bytes.Length);
gzip.Flush();
gzip.Close();
byte[] gzipBytes = ms.ToArray();
ms.Close();
string hexStr = byteArrayToHexString(gzipBytes);
return SplitString(hexStr);
}
本文介绍了一个GZip数据压缩过程中的优化技巧,通过使用MemoryStream的ToArray方法替代GetBuffer方法,有效减少了压缩后的字节数组中包含的多余零字节,从而实现了更高效的压缩效果。
930





