在生产环境中使用 Docker,往往需要对数据进行持久化,或者需要在多个容器之间进行数据共享,这必然涉及容器的数据管理操作。容器中的管理数据主要有两种方式 :
- 数据卷 ( Data Volumes ) : 容器内数据直接映射到本地主机环境;
- 数据卷容器( Data Volume Containers ) : 使用特定容器维护数据卷。
数据卷
数据卷 ( Data Volumes ) 是一个可供容器使用的特殊目录,它将主机操作系统目录直接映射进容器,类似于 Linux 中的 mount行为 。
数据卷可以提供很多有用的特性 :
- 数据卷可以在容器之间共享和重用,容器间传递数据将变得高效与方便;
- 对数据卷内数据的修改会立马生效,无论是容器内操作还是本地操作;
- 对数据卷的更新不会影响镜像,解耦开应用和数据 ;
- 卷会一直存在 ,直到没有容器使用,可以安全地卸载它 。
创建数据卷
Docker 提供了 volume 子命令来管理数据卷,如下命令可以快速在本地创建一个数据卷:
docker volume create -d local test
此时 ,查看/var/lib/docker/volumes 路径下,会发现所创建的数据卷位置 :
除了 create 子命令外, docker volume 还支持 inspect (查看详细信息)、 ls (列出已有数据卷)、 prune (清理无用数据卷)、 rm (删除数据卷)等。
绑定数据卷
除了使用 vo lume 子命令来管理数据卷外,还可以在创建容器时将主机本地的任意路径挂载到容器内作为数据卷,这种形式创建的数据卷称为绑定数据卷 。
在用 docker [container] run命令的时候,可以使用 -mount 选项来使用数据卷。
-mount 选项支持三种类型的数据卷,包括 :
- volume : 普通数据卷,映射到主机/var/ lib /docker/volumes 路径下;
- bind :绑定数据卷,映射到主机指定路径下;
- tmpfs :临时数据卷,只存在于内存中 。
下面使用 training/webapp 镜像创建一个 Web 容器,并创建一个数据卷挂载到容器的/ opt/webapp 目录:
docker run -d -P --name web -v /webapp:/opt/webapp training/webapp python app.py
本地目录的路径必须是绝对路径,容器内路径可以为相对路径 。 如果目录不存在, Docker 会自动创建 。
Docker 挂载数据卷的默认权限是读写( rw ) ,用户 也可以通过 ro 指定为只读 :
docker run -d -P --name web -v /webapp:/opt/webapp:ro training/webapp python app.py
加了:ro 之后,容器内对所挂载数据卷内的数据就无法修改了 。
如果直接挂载一个文件到容器,使用文件编辑工具,包括 vi 或者 sed - - in place的时候,可能会造成文件 inode 的改变 。 从 Docker 1.1.0 起,这会导致报错误信息 。 所以推荐的方式是直接挂载文件所在的目录到容器内。
数据卷容器
如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器 。 数据卷容器也是一个容器,但是它的目的是专门提供数据卷给其他容器挂载。
首先,创建一个数据卷容器 dbdata , 并在其中创建一个数据卷挂载到/dbdata :
docker run -it -v /dbdata --name dbdata ubuntu
然后,可以在其他容器中使用--volumes-from 来挂载 dbdata 容器中的数据卷,例如创建 dbl 和 db2 两个容器,并从 dbdata 容器挂载数据卷:
docker run -it --volumes-from dbdata --name db1 ubuntu
docker run -it --volumes-from dbdata --name db2 ubuntu
此时, 容器 dbl 和 db2 都挂载同一个数据卷到相同的/dbdata 目录,三个容器任何一方在该目录下的写人,其他容器都可以看到 。例如,在 dbdata 容器中创建一个 test 文件:
可以多次使用--volumes-from 参数来从多个容器挂载多个数据卷,还可以从其他已经挂载了容器卷的容器来挂载数据卷 :
docker run -it --name db3 --volumes-from db1 ubuntu
使用--volumes-from 参数所挂载数据卷的容器自身并不需要保持在运行状态。
如果删除了挂载的容器(包括 dbdata 、 db1和 db2 ),数据卷并不会被自动删除。 如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用 docker rm -v 命令来指定同时删除关联的容器 。
利用数据卷容器来迁移数据
可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移 。
备份
使用下面的命令来备份 dbdata 数据卷容器内的数据卷 :
docker run --volumes-from dbdata -v $(pwd):/backup --name worker ubuntu tar cvf /backup/backup.tar /dbdata
恢复