这一章讲解了文件的压缩,文件是将数据存储在磁盘等存储媒介中的一种形式。程序文件中存储数据的单位是字节。文件就是字节数据的集合。压缩的文件的扩展名有LZH和ZIP等,当文件太大放不下时,会采用文件压缩的方法。文件是以字节为单位存储的,文件其实就是字节数据的集合,字节数据是连续存储的。用“数据 * 压缩次数”的形式来表示的压缩方法为RLE算法,该算法经常用于压缩传真的图像,该算法的缺点是不适合进行文本文件的压缩,通过莫尔斯编码来看哈夫曼算法的基础,可以用二叉树实现哈夫曼编码,哈夫曼编码是指,为各压缩对象文件分别构造最佳的编码体系,并以该编码体系为基础进行压缩,哈夫曼算法能够大幅度提升压缩比率。
可逆压缩和非可逆压缩,对于图像文件来说,即使有事无法还原到压缩前的那样鲜明的图像状态,但肉眼看不出什么区别,有一些模糊也可以勉强接受,把能还原到压缩前状态的压缩称为可逆压缩,无法还原到压缩前状态的压缩称为不可逆压缩。