docker储存卷

本文详细介绍了Docker的COW机制,探讨了为何使用存储卷的原因,如提高I/O性能。接着,文章讲解了存储卷的概念、原理和分类,如绑定挂载卷和Docker管理卷。此外,还阐述了容器数据管理,包括数据卷和数据卷容器的使用,以及如何利用数据卷容器进行数据备份和恢复,实现数据迁移。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.COW机制

COW技术原理(Copy On Write,写时复制)

  • 针对随时变化的数据进行备份
  • 直接映射原始盘的数据内容
  • 当原始盘的旧数据有修改时,在修改之前自动将旧数据存入前端盘
  • 对前端盘的修改不回写到原始盘
  • 前端盘:永远显示在制作出前端盘那一瞬间原始盘所有数据内容

Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。

如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本依然存在,只是已经被读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。
在这里插入图片描述

2.为什么要使用存储卷

对于这类的操作,修改删除等,一般效率非常低,如果对一于I/O要求比较高的应用,如redis在实现持化存储时,是在底层存储时的性能要求比较高。
假设底层运行一个存储库mysql,mysql本来对于I/O的要求就比较高,如果mysql又是运行在容器中自己的文件系统之上时,也就是容器在停止时,就意味着删除,其实现数据存取时效率比较低,要避免这个限制要使用存储卷来实现。
存在的问题:

  • 存储于联合文件系统中,不易于宿主机访问;
  • 容器间数据共享不便
  • 删除容器其数据会丢失

解决方案:“卷(volume)”
   “卷"是容器上的一个或多个"目录”;此类目录可绕过联合文件系统,与宿主机上的某目录"绑定(关联)"
在这里插入图片描述

3.存储卷

“卷”是容器上的一个或多个“目录”,此类目录可绕过联合文件系统,与宿主机上的某个目录“绑定(关联)”;

类似于挂载一样,宿主机的/data/web目录与容器中的/container/data/web目录绑定关系,然后容器中的进程向这个目录中写数据时,是直接写在宿主机的目录上的,绕过容器文件系统与宿主机的文件系统建立关联关系,使得可以在宿主机和容器内共享数据库内容,让容器直接访问宿主机中的内容,也可以宿主机向容器供集内容,两者是同步的。

mount名称空间本来是隔离的,可以让两个本来是隔离的文件系统,在某个子路径上建立一定程度的绑定关系,从而使得在两个容器之间的文件系统的某个子路径上不再是隔离的,实现一定程度上共享的效果。

在宿主机上能够被共享的目录(可以是文件)就被称为volume。
在这里插入图片描述

4.存储卷原理

  • volume于容器初始化之时会创建,由base image提供的卷中的数据会于此期间完成复制
  • volume的初意是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对哪怕未被引用的卷做垃圾回收操作
  • 卷为docker提供了独立于容器的数据管理机制
    • 可以把“镜像”想像成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”,于是,镜像可以重用,而卷可以共享
    • 卷实现了“程序(镜像)"和”数据(卷)“分离,以及”程序(镜像)“和"制作镜像的主机”分离,用记制作镜像时无须考虑镜像运行在容器所在的主机的环境

5.存储卷分类

Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上位置有所不同;

Bind mount volume(绑定挂载卷):在宿主机上的路径要人工的指定一个特定的路径,在容器中也需要指定一个特定的路径,两个已知的路径建立关联关系
Docker-managed volume(docker管理卷): 只需要在容器内指定容器的挂载点是什么,而被绑定宿主机下的那个目录,是由容器引擎daemon自行创建一个空的目录,或者使用一个已经存在的目录,与存储卷建立存储关系,这种方式极大解脱用户在使用卷时的耦合关系,缺陷是用户无法指定那些使用目录,临时存储比较适合;
在这里插入图片描述

6.容器数据管理

用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。

容器中管理数据主要有两种方式:

  • 数据卷(Data Volumes)
  • 数据卷容器(Data Volumes Containers)

6.1在容器中使用数据卷

使用nginx镜像创建一个web容器,并创建一个数据卷挂载到容器的/web目录下

[root@wyt1 ~]# docker run -d -P --name web -v /web nginx
957aea67550274852c45301e80b636369afea3c4dbf99522c119f75f20a00c0f
[root@wyt1 ~]# docker ps 
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS              PORTS                   NAMES
957aea675502        nginx               "/docker-entrypoint.…"   9 seconds ago       Up 8 seconds        0.0.0.0:32768->80/tcp   web
[root@wyt1 ~]# docker port 957aea675502
80/tcp -> 0.0.0.0:32768

这里的-P是允许外部访问容器需要暴露的端口。
挂载一个主机目录作为数据卷

[root@wyt1 ~]# docker run -d -P --name web1 -v /var/www/html:/web nginx

上面的命令加载主机的/var/www/html目录到容器的/web目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。

Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:

[root@wyt1 ~]# docker run -d -P --name web2 -v /var/www/html:/web:ro nginx
[root@wyt1 ~]# ll -d /var/www/html/
drwxr-xr-x 2 root root 6 Aug 30 09:06 /var/www/html/

加了:ro以后,容器内挂载的数据卷的数据就无法修改了。

挂载一个本地主机文件作为数据卷

[root@wyt1 ~]# docker run -it --rm -v ~/.bash_history:/.bash_history centos
[root@2a2f435b4d36 /]# wc -l .bash_history 
375 .bash_history

如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。所以推荐的方式是直接挂载文件所在的目录。

6.2 数据卷容器

如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:
创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata

[root@wyt1 ~]# docker run -it -d --name dbdata -v /dbdata centos

然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:

[root@wyt1 ~]#  docker run -it --name db1 --volumes-from dbdata centos
[root@b2f220aba410 /]# 

[root@wyt1 ~]#  docker run -it --name db1 --volumes-from dbdata centos
[root@95b4abe57baf /]#

容器db1和db2都挂载同一个数据卷到相同的/dbdata目录。三个容器任何一方在该目录下的写入,其他容器都可以看到。

[root@b2f220aba410 /]# cd dbdata/
[root@b2f220aba410 dbdata]# touch abc
[root@b2f220aba410 dbdata]# ls
abc
[root@95b4abe57baf /]# cd dbdata/
[root@95b4abe57baf dbdata]# ls
abc
[root@wyt1 ~]# docker exec -it 578eaed4d9c3  /bin/bash
[root@578eaed4d9c3 /]# cd dbdata/
[root@578eaed4d9c3 dbdata]# ls
abc

可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。还可以从其他已挂载了容器卷的容器来挂载数据卷:

[root@wyt1 ~]# docker run -it --name db3 --volumes-from db1 centos

使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。

6.3利用数据卷容器迁移数据

可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。

备份

[root@wyt1 ~]# docker run --name worker --volumes-from dbdata -v $(pwd):/backup centos tar -zcf /backup/backup.tar.gz /dbdata
tar: Removing leading `/' from member names
[root@wyt1 ~]# ls
anaconda-ks.cfg  backup.tar.gz

首先利用centos镜像创建了一个容器worker。
使用–volumes-from dbdata参数来让worker容器挂载dbdata容器的数据卷(即dbdata数据卷);使用-v $(pwd):/backup参数来挂载本地的当前目录到worker容器的/backup目录。
worker容器启动后,使用了tar -zcf /backup/backup.tar.gz /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar.gz,即宿主主机当前目录下的backup.tar.gz。

恢复

创建一个带有数据卷的容器dbdata2

[root@wyt1 ~]# docker run -it --name dbdata2 -v /dbdata centos /bin/bash
[root@5cf94f162404 /]# ls
bin	dev  home  lib64       media  opt   root  sbin	sys  usr
dbdata	etc  lib   lost+found  mnt    proc  run   srv	tmp  var
[root@5cf94f162404 /]# cd dbdata/
[root@5cf94f162404 dbdata]# ls

创建另一个新的容器,挂载dbdata2容器,并使用tar解压备份文件到所挂载的容器卷中

[root@wyt1 ~]# docker run -it --rm --volumes-from dbdata2 -v $(pwd):/backup busybox tar xf /backup/backup.tar.gz

//dbdata2查看
[root@5cf94f162404 dbdata]# ls
abc
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值