1. COW机制
COW技术原理(Copy On Write,写时复制)
针对随时变化的数据进行备份
Ø 直接映射原始盘的数据内容
Ø 当原始盘的旧数据有修改时,在修改之前自动将旧数据存入前端盘
Ø 对前端盘的修改不回写到原始盘
Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。
如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。
对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。
而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。
2. 存储卷
“卷”是容器上的一个或多个“目录”,此类目录可绕过联合文件系统,与宿主机上的某个目录“绑定(关联)”;
类似于挂载一样,宿主机的/data/web目录与容器中的/container/data/web目录绑定关系,然后容器中的进程向这个目录中写数据时,是直接写在宿主机的目录上的,绕过容器文件系统与宿主机的文件系统建立关联关系,使得可以在宿主机和容器内共享数据库内容,让容器直接访问宿主机中的内容,也可以宿主机向容器供集内容,两者是同步的。
mount名称空间本来是隔离的,可以让两个本来是隔离的文件系统,在某个子路径上建立一定程度的绑定关系,从而使得在两个容器之间的文件系统的某个子路径上不再是隔离的,实现一定程度上共享的效果。
在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。
2.1 存储卷的作用
优点是容器中进程所生成的数据,都保存在存储卷上,从而脱离容器文件系统自身后,当容器被关闭甚至被删除时,都不用担心数据被丢失,实现数据可以脱离容器生命周期而持久,当再次重建容器时,如果可以让它使用到或者关联到同一个存储卷上时,再创建容器,虽然不是之前的容器,但是数据还是那个数据,特别类似于进程的运行逻辑,进程本身不保存任何的数据,数据都在进程之外的文件系统上,或者是专业的存储服务之上,所以进程每次停止,只是保存程序文件,对于容器也是一样;容器就是一个有生命周期的动态对象来使用,容器关闭就是容器删除的时候,但是它底层的镜像文件还是存在的,可以基于镜像再重新启动容器。
但是容器有一个问题,一般与进程的启动不太一样,就是容器启动时选项比较多,如果下次再启动时,很容器会忘记它启动时的选项,所以最好有一个文件来保存容器的启动,这就是容器编排工具的作用。一般情况下,是使用命令来启动操作docker,但是可以通过文件来读,也就读文件来启动,读所需要的存储卷等,但是它也只是操作一个容器,这也是需要专业的容器编排工具的原因。
另一个优势就是容器就可以不置于启动在那台主机之上了,如几台主机后面挂载一个NFS,在各自主机上创建容器,而容器上通过关联到宿主机的某个目录上,而这个目录也是NFS所挂载的目录中,这样容器如果停止或者是删除都可以不限制于只能在原先的宿主机上启动才可以,可以实现全集群范围内调试容器的使用,当再分配存储、计算资源时,就不会再局限于单机之上,可以在集群范围内建立起来,基本各种docker的编排工具都能实现此功能,但是后面严重依赖于共享存储的使用。
2.2 存储卷的原理
volume于容器初始化之时会创建,由base image提供的卷中的数据会于此期间完成复制
volume的初意是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对哪怕未被引用的卷做垃圾回收操作
卷为docker提供了独立于容器的数据管理机制
- 可以把“镜像”想像成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”,于是,镜像可以重用,而卷可以共享
- 卷实现了“程序(镜像)"和”数据(卷)“分离,以及”程序(镜像)“和"制作镜像的主机”分离,用记制作镜像时无须考虑镜像运行在容器所在的主机的环境
2.3 存储卷的分类
Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上位置有所不同;
Bind mount volume(绑定挂载卷):
在宿主机上的路径要人工的指定一个特定的路径,在容器中也需要指定一个特定的路径,两个已知的路径建立关联关系
语法:
docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME
Docker-managed volume(docker管理卷):
只需要在容器内指定容器的挂载点是什么,而被绑定宿主机下的那个目录,是由容器引擎daemon自行创建一个空的目录,或者使用一个已经存在的目录,与存储卷建立存储关系,这种方式极大解脱用户在使用卷时的耦合关系,缺陷是用户无法指定那些使用目录,临时存储比较适合
语法:
docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME
3. 容器数据管理
用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。
容器中管理数据主要有两种方式:
- 数据卷(Data Volumes)
- 数据卷容器(Data Volumes Containers)
3.1 使用数据卷
3.1.1 使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录下
[root@node02 ~]# docker run -d -P --name web -v /webapp nginx
[root@node02 ~]# docker port web
80/tcp -> 0.0.0.0:32768
这里的-P是允许外部访问容器需要暴露的端口。
3.1.2 挂载一个主机目录作为数据卷
[root@node02 ~]# docker run -d -P --name web1 -v /var/www/html:/webapp nginx
加载主机的/var/www/html目录到容器的/webapp目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。
3.1.3 Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:
[root@node02 ~]# docker run -d -P --name web2 -v /var/www/html:/webapp:ro nginx
[root@node02 ~]# ll -d /var/www/html/
drwxr-xr-x 2 root root 4096 Aug 30 17:08 /var/www/html/
加了:ro以后,容器内挂载的数据卷的数据就无法修改了。
3.1.4 挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷
[root@node02 ~]# docker run -it --rm -v ~/.bash_history:/.bash_history centos
这样就可以记录在容器输入过的命令历史了。
[root@89dc01cc71dd /]# history
1 ls -a /
2 cat /.bash_history
3 history
如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。
3.2 数据卷容器
如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用
创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata
[root@node02 ~]# docker run -it --name dbdata -v /dbdata centos
[root@3751112a7e71 /]#
然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷
[root@node02 ~]# docker run -it --name db1 --volumes-from dbdata centos
[root@14971f03c4c1 /]#
[root@node02 ~]# docker run -it --name db2 --volumes-from dbdata centos
[root@398fa3d883d8 /]#
此时,容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。
在db1容器中创建文件
[root@14971f03c4c1 /]# ls dbdata/
[root@14971f03c4c1 /]# touch dbdata/abc
[root@14971f03c4c1 /]# ls dbdata/
abc
在dbdata容器中查看
[root@3751112a7e71 /]# ls dbdata/
abc
在db2容器中查看
[root@398fa3d883d8 /]# ls dbdata/
abc
可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷
使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态
如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器
3.3 利用数据卷容器迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份
[root@node02 ~]# docker run --name worker --volumes-from dbdata -v $(pwd):/backup centos tar -zcf /backup/backup.tar.gz /dbdata
[root@node02 ~]# ls
backup.tar.gz
分析一下这条命令:
首先利用centos镜像创建了一个容器worker。
使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);
使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar -zcf /backup/backup.tar.gz /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar.gz,即宿主主机当前目录下的backup.tar.gz。
恢复
创建一个带有数据卷的容器dbdata2
[root@node02 ~]# docker run -it --name dbdata2 -v /dbdata centos
[root@e06d3f715b11 /]# ls
bin etc lib64 mnt root srv usr
dbdata home lost+found opt run sys var
dev lib media proc sbin tmp
[root@e06d3f715b11 /]# ls dbdata/
[root@e06d3f715b11 /]#
然后创建另一个新的容器,挂载dbdata2容器,并解压备份文件到所挂载的容器卷中
[root@node02 ~]# docker run --volumes-from dbdata2 -v $(pwd):/backup busybox tar xf /backup/backup.tar.gz
db2容器上查看
[root@e06d3f715b11 /]# ls dbdata/
abc