浅析 Dockerfile 构建缓存：原理与优化方法

原创已于 2024-06-11 22:27:21 修改 · 1.8k 阅读

CC 4.0 BY-SA版权

文章标签：

于 2023-12-31 23:59:21 首次发布

9 篇文章

订阅专栏

本文详细解释了Docker镜像的分层结构，强调了UnionFS的作用以及构建镜像时如何利用缓存。介绍了构建缓存的工作原理，特别是ADD/COPY和RUN指令对缓存的影响，以及如何通过合并指令和正确安排顺序来最大化缓存效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

构建镜像时，Docker 按照顺序逐步执行 Dockerfile 中的指令。对于每条指令，Docker 检查它是否可以重用构建缓存中的指令。

如果引用的父镜像在构建缓存中，下一个指令将会和所有从该基础镜像派生的子镜像做比较，如果和其中一个子镜像的指令相同，那么缓存命中，否则缓存失效
在大部分情况下，通过比较Dockerfile中的指令和子镜像已经足够了，但是有些指令需要进一步的检查
对于ADD和COPY指令，文件的内容会被检查，并且会计算每一个文件的校验码。在缓存查找期间，如果文件内容或元数据发生更改，那么缓存就会失效
除了ADD和COPY指令之外，缓存检查不会查看容器中的文件来判断是否命中缓存。例如，在处理RUN apt-get -y update指令时，不会检查容器中的更新文件来确定是否命中缓存，这种情况下只会检查指定字符串是否相同

一旦缓存失效，所有后续的 Dockerfile 指令都会生成新的镜像层，不再使用缓存。

将多个命令合并成单个RUN指令时，同时也要考虑将变更频率不同的命令分开
指令从变更不频繁到变更频繁的顺序来写
a. 一般源代码会经常变化，所以要把安装依赖等不经常变动的步骤写在前面，拷贝源代码等经常变动的步骤写在后面
b.如果是Python项目的话，先拷贝requerements.txt，然后进行pip install requerements.txt，最后再进行COPY代码
ARG指令的变量值变化会导致缓存失效，所以最好在使用前定义，不要过早使用