概念
归档,也称为打包,指的是一个文件或目录的集合,而这个集合被存储在一个文件中。归档文件没有经过压缩,因此,它占用的空间是其中所有文件和目录的总和
通常,归档总是会和系统(数据)备份联系在一起
和归档文件类似,压缩文件也是一个文件和目录的集合,且这个集合也被存储在一个文件中,但它们的不同之处在于,压缩文件采用了不同的存储方式,使其所占用的磁盘空间比集合中所有文件大小的总和要小
压缩是指利用算法将文件进行处理,已达到保留最大文件信息,而让文件体积变小的目的。其基本原理为,通过查找文件内的重复字节,建立一个相同字节的词典文件,并用一个代码表示。
由于计算机处理的信息是以二进制的形式表示的,因此,压缩软件就是把二进制信息中相同的字符串以特殊字符标记,只要通过合理的数学计算,文件的体积就能够被大大压缩。把一个或者多个文件用压缩软件进行压缩,形成一个文件压缩包,既可以节省存储空间,又方便在网络上传送
如果你能够理解文件压缩的基本原理,那么很容易就能想到,对文件进行压缩,很可能损坏文件中的内容,因此,压缩又可以分为有损压缩和无损压缩。无损压缩很好理解,指的是压缩数据必须准确无误;有损压缩指的是即便丢失个别的数据,对文件也不会造成太大的影响。有损压缩广泛应用于动画、声音和图像文件中,典型代表就是影碟文件格式 mpeg、音乐文件格式 mp3 以及图像文件格式 jpg。
采用压缩工具对文件进行压缩,生成的文件称为压缩包,该文件的体积通常比原文件小很多。需要注意的是,压缩包中的数据无法直接使用,使用前需要利用压缩工具将文件数据还原,此过程又称解压缩
1.zip命令
通过此命令压缩得到的新文件,其扩展名通常标记为“.zip”
注意,zip 压缩命令需要手工指定压缩之后的压缩包名,建议自己写好.zip扩展名,以便区别及解压缩时使用。
zip命令在压缩任务完成后,默认会保留原始文件
常用选项:
-r: 递归压缩目录,及将制定目录下的所有文件以及子目录全部压缩。
-m: 将文件压缩之后,删除原始文件,相当于把文件移到压缩文件中。
-v: 显示详细的压缩过程信息。
-q: 在压缩的时候不显示命令的执行过程。
-压缩级别: 压缩级别是从 1~9 的数字,-1 代表压缩速度更快,-9 代表压缩效果更好。
-u: 更新压缩文件,即往压缩文件中添加新文件。
-d: 从压缩文件内删除指定的文件。
[root@localhost ~]# mkdir file6
[root@localhost ~]#
[root@localhost ~]# zip file6.zip file6
adding: file6/ (stored 0%)
[root@localhost ~]#
[root@localhost ~]# ls
anaconda-ks.cfg file1 file6 file6.zip test test! test!! test.zip xaa
[root@localhost ~]#
注:
压缩率(Compression ratio),描述压缩文件的效果名,是文件压缩后的大小与压缩前的大小之比
例如:把100m的文件压缩后是90m,压缩率为90/100*100%=90%,压缩率一般是越小越好,但是压得越小,解压时间越长。
压缩效率越大压缩后的文件越小,解压时间越长
[root@localhost ~]# zip -m file6.zip file6
adding: file6/ (stored 0%)
[root@localhost ~]# ls
anaconda-ks.cfg file1 file6.zip test test! test!! test.zip xaa
删除当前下的所有 除了某个文件
[root@localhost ~]# zip all.zip ./* -x anaconda-ks.cfg
adding: file1/ (stored 0%)
adding: test (stored 0%)
adding: test! (deflated 44%)
adding: test!! (deflated 47%)
adding: xaa (deflated 83%)
[root@localhost ~]# ls
all.zip anaconda-ks.cfg file1 test test! test!! xaa
2.unzip
可以查看和解压缩zip文件文件
unzip命令在解压缩任务完成后,默认会保留原始文件
常用选项:
-d: 目录名 将压缩文件解压到指定目录下。
-n: 解压时并不覆盖已经存在的文件。
-o: 解压时覆盖已经存在的文件,并且无需用户确认。
-v: 查看压缩文件的详细信息,包括压缩文件中包含的文件大小、文件名以及压缩比等,但并不做解压操作。
-t: 测试压缩文件有无损坏,但并不解压。
-x: 文件列表 解压文件,但不包含文件列表中指定的文件。
3.gzip命令
gzip不仅可以用来压缩大的、较少使用的文件以节省磁盘空间,还可以和tar命令一起构成Linux操作系统中比较流行的压缩文件格式。据统计,gzip命令对文本文件有60%~70%的压缩率。
gzip命令在压缩或解压缩任务完成后,默认会删除原始文件
常用选项:
-c: 将压缩数据输出到标准输出中,并保留源文件。
-d: 对压缩文件进行解压缩。
-r: 递归压缩指定目录下以及子目录下的所有文件。
-v: 对于每个压缩和解压缩的文件,显示相应的文件名和压缩比。
-l: 对每一个压缩文件,显示压缩信息(压缩文件的大小;未压缩文件的大小;压缩比;未压缩文件的名称)
-数字: 用于指定压缩等级,-1 压缩等级最低,压缩比最差;-9 压缩比最高。默认压缩比是 -6。
-t: 测试压缩文件的完整性
gzip 压缩命令非常简单,甚至不需要指定压缩之后的压缩包名,只需指定源文件名即可
[root@localhost ~]# gzip test
[root@localhost ~]# ls
all.zip anaconda-ks.cfg file1 test! test!! test.gz xaa
-c重定向的文件为压缩文件 源文件保留
[root@localhost ~]# gzip -c test1 > test1.zip
[root@localhost ~]# ls
all.zip anaconda-ks.cfg file1 file5 file5.zip test!! test1 test1.zip test.gz xaa
递归的压缩目录
[root@admin roottest]# ls
passwd9.zip.gz test001
[root@admin roottest]# gzip -r test001/
[root@admin roottest]# ls ##但是查看发现test001目录依然存在,并没有变为压缩文件
passwd9.zip.gz test001
[root@admin roottest]# cd test001
[root@admin test001]# ls #察看其子目录
01file.gz 02file.gz 03file.gz 04file.gz ii
[root@admin test001]# cd ii
[root@admin ii]# ls
1hehe.gz 2hehe.gz 3hehe.gz oo #发现test001目录下的所有文件都被压缩了,但所有目录均没有被压缩
强调:gzip 命令只能用来压缩文件,不能压缩目录,即便指定了目录,也只能压缩目录内的所有文件
递归的解压目录
[root@admin roottest]# gzip -dr test/
1
就是test目录下的所有.gz压缩包进行解压(可以达到目录树的最深)
4.gunzip
用于解压被gzip 压缩的文件
常用选项:
-r: 递归处理,解压缩指定目录下以及子目录下的所有文件。
-c: 把解压缩后的文件输出到标准输出设备。
-f: 强制解压缩文件,不理会文件是否已存在等情况。
-l: 列出压缩文件内容。
-v: 显示命令执行过程。
-t: 测试压缩文件是否正常,但不对其做解压缩操作。
"gunzip -r"依然只会解压缩目录下的.gz文件,而不会解打包。等价于gzip -dr
5.bzip2
bzip2 命令同 gzip 命令类似,只能对文件进行压缩(或解压缩),对于目录只能压缩(或解压缩)该目录及子目录下的所有文件。当执行压缩任务完成后,会生成一个以“.bz2”为后缀的压缩包
“.bz2"格式是 Linux 的另一种压缩格式,从理论上来讲,”.bz2"格式的算法更先进、压缩比更好;而 ".gz"格式相对来讲的时间更快。
bzip2命令在压缩或解压缩任务完成后,默认会删除原始文件
常用选项:
-d: 执行解压缩,此时该选项后的源文件应为标记有 .bz2 后缀的压缩包文件。
-k: bzip2 在压缩或解压缩任务完成后,会删除原始文件,若要保留原始文件,可使用此选项。
-f: bzip2 在压缩或解压缩时,若输出文件与现有文件同名,默认不会覆盖现有文件,若使用此选项,则会强制覆盖现有文件。
-t: 测试压缩包文件的完整性。
-v: 压缩或解压缩文件时,显示详细信息。
-数字: 这个参数和 gzip 命令的作用一样,用于指定压缩等级,-1 压缩等级最低,压缩比最差;-9 压缩比最高
注意,gzip 只是不会打包目录,但是如果使用“-r”选项,则可以分别压缩目录下的每个文件;而 bzip2 命令则根本不支持压缩目录,也没有“-r”选项
6.bunzip
bz2格式的解压缩命令
要解压“.bz2”格式的压缩包文件,除了上面讲到的使用“ bzip2 -d 压缩包名 ”命令外,还可以使用 bunzip2 命令
bunzip2 命令的使用和 gunzip 命令大致相同,bunzip2 命令只能用于解压文件,即便解压目录,也是解压该目录以及所含子目录下的所有文件
bunzip2 命令在解压缩任务完成后,默认会删除原始文件
用法:bunzip2 [选项] 源文件
常用选项:
-k: 解压缩后,默认会删除原来的压缩文件。若要保留压缩文件,需使用此参数。
-f: 解压缩时,若输出的文件与现有文件同名时,默认不会覆盖现有的文件。若要覆盖,可使用此选项。
-v: 显示命令执行过程。
7.xz和unxz
xz命令对文件进行压缩(或解压缩),当执行压缩任务完成后,会生成一个以“ .xz ”为后缀的压缩包。
xz 命令完成压缩或解压缩任务时,默认会删除源文件
用法:xz [选项] 源文件
常用选项:
-d:解压缩
-#:指定压缩比;默认是6;数字越大压缩比越大(1-9);
-k:保留原文件;
unxz 命令
要解压“ .xz ”格式的压缩包文件,除了上面讲到的使用“xz -d 压缩包名 ”命令外,还可以使用 unxz 命令
常用选项:
-k 保留源文件
8、显示压缩文件内容
如果我们压缩的是一个纯文本文件,则可以直接使用以下命令查看压缩文件中的内容:
对于" .gz “格式的压缩包:zcat,zless
对于” .bz2 " 格式的压缩包:bzcat,bzless
对于" .xz " 格式的压缩包:xzcat,xzless
9.打包归档命令
tar 命令可以为linux的文件和目录创建档
利用 tar,可以为某一特定文件创建档案(备份文件),也可以在档案中改变文件,或者向档案中加入新的文件。tar 最初被用来在磁带上创建档案,现在,用户可以在任何设备上创建档案。利用 tar 命令,可以把一大堆的文件和目录全部打包成一个文件,这对于备份文件或将几个文件组合成为一个文件以便于网络传输是非常有用的。通常,归档总是会和系统(数据)备份联系在一起
首先要弄清两个概念:打包和压缩。打包是指将一大堆文件或目录变成一个总的文件;压缩则是将一个大的文件
通过一些压缩算法变成一个小文件
为什么要区分这两个概念呢?这源于 Linux 中很多压缩程序只能针对一个文件进行压缩,这样当你想要压缩一大
堆文件时,你得先将这一大堆文件先打成一个包(tar命令),然后再用压缩程序进行压缩(gzip bzip2命令)。
功能:该命令可以将许多文件一起保存到一个单独的磁带或磁盘中进行归档。不仅如此,该命令还可以从归档文件中还原所需文件,也就是打包的反过程,称为解打包
**(一)tar命令做打包操作
常用选项:
-c: 将文件进行打包。
-A: 追加 tar 文件到归档文件。
-f 包名: 指定包的文件名。包的扩展名是用来给管理员识别格式的,所以一定要正确指定扩展名;这个参数是最后 一个参数,后面只能接包的文件名
-v: 显示打包文件过程;
-r:向压缩归档文件末尾追加文件
- -remove-files :在添加文件至归档后删除它们**
-r
[root@admin Dir]# tar -rf file.tar test.tar.gz #将test.tar.gz文件追加到file.tar归档文件中
[root@admin Dir]# tar -tf file.tar #查看是否添加成功
file
test.tar.gz
file1
file99
test.tar.gz #在该归档文件末尾可以看到添加成功
-A
[root@admin demo]# tar -tf demo.tar #查看file.tar包中的文件
demo1
demo2
[root@admin demo]# tar -tf file.tar #查看demo.tar包中的文件
./file1
./file2
./file3
[root@admin demo]# tar -Af file.tar demo.tar #将emo.tar包进行解打包并将解打包后的文件追加到file.tar包中
[root@admin demo]# tar -tf file.tar
./file1
./file2 #如果是使用-r选项的话只是将demo.tar包文件直接追加到file.tar包中
./file3
demo1
demo2
(二)tar命令做解打包操作
当 tar 命令用于对 tar 包做解打包操作时,该命令的用法为: tar [选项] 压缩包
解打包操作完成后,源文件默认还会保留
当用于解打包时,常用的选项为:
-x: 对 tar 包做解打包操作。
-f: 指定要解压的 tar 包的包名。
-t: 只查看 tar 包中有哪些文件或目录,不对 tar 包做解打包操作。
-C 目录: 指定解打包位置。
-v: 显示解打包的具体过程。
其实解打包和打包相比,只是把打包选项 “-cvf” 更换为 “-xvf”
如果使用 “-xvf” 选项,则会把包中的文件解压到当前目录下。如果想要指定解压位置,则需要使用 “-C(大写)” 选项
[root@admin Dir]# tar -xvf dir.tar.gz -C /tmp
test/
test/file0
test/file1
test/file2
test/file3
test/dir/
test/dir/demo1
test/dir/demo2
test/dir/demo3
如果只想查看文件包中有哪些文件,则可以把解打包选项 “-x” 更换为测试选项 “-t”
[root@admin Dir]# tar tvf dir.tar.gz #会用长格式显示test.tar文件包中文件的详细信息
drwxr-xr-x root/root 0 2020-08-04 14:39 test/
-rw-r--r-- root/root 0 2020-08-04 14:39 test/file0
-rw-r--r-- root/root 0 2020-08-04 14:39 test/file1
-rw-r--r-- root/root 0 2020-08-04 14:39 test/file2
-rw-r--r-- root/root 0 2020-08-04 14:39 test/file3
drwxr-xr-x root/root 0 2020-08-04 14:40 test/dir/
-rw-r--r-- root/root 0 2020-08-04 14:40 test/dir/demo1
-rw-r--r-- root/root 0 2020-08-04 14:40 test/dir/demo2
-rw-r--r-- root/root 0 2020-08-04 14:40 test/dir/demo3
(三)tar命令做打包压缩(解压缩解打包)操作
常用选项:
-z:压缩和解压缩 “.tar.gz” 格式;
-j:压缩和解压缩 ".tar.bz2"格式。
-J: 压缩和解压缩 ".tar.xz"格式
压缩与解压缩 ".xz"格式
#将/tmp/打包并压缩为tmp.tar.xz
[root@admin Dir]# tar -Jcvf tmp.tar.xz /tmp/
[root@admin Dir]# ls
tmp.tar.xz
[root@admin Dir]# tar -tf tmp.tar.xz #查看该压缩包中的内容
……省略此命令执行后的输出结果……
#将tmp.tar.xz解压并解打包到/usr/local目录下
[root@admin Dir]# tar -Jxvf tmp.tar.xz -C /usr/local/
[root@admin local]# cd /usr/local
[root@admin local]# ll -d tmp
drwxrwxrwt 35 root root 4096 8月 4 15:01 tmp
将/var/log/messages打包压缩成mess.tar.gz后,并删除源文件:
[root@admin ~]# tar -czf mess.tar.gz /var/log/messages --remove-files
1
将 mess.tar.gz 解压缩解打包后,并删除源文件:
[root@admin ~]# tar -xvf mess.tar.gz && rm -rf mess.tar.gz