如何合并两个Docker 镜像

 陈光 分布式实验室

如何合并两个Docker 镜像

常言道,“不要重复发明*!”

在使用Docker时,构建自己的镜像之前,最好在Docker Hub 寻找一些可以直接使用的镜像做练习。把你的软件架构分布到一系列容器中,每一个容器只做一件事情,这样的效果非常好。构建分布式应用的最好的基石是使用来自Docker Hub的官方镜像,因为你可以信任它们的质量。

在某些情况下,你可能想让一个容器做两件不同的事情。而在另外一些情况下,你可能想让一个Docker镜像包含来自两个不同镜像的依赖库。如果你有每个镜像的Dockerfile,这是非常简单的。将它们组织到一个Dockerfile里然后build就行。

然而,大多数时间你都在使用Docker Hub上准备好的镜像,你不会有它们的源Dockerfile。我花时间找一个可以合并(或flatten)两个不同Docker镜像的工具,当然我没有它们的Dockerfile。也就是说我在找一个能做下面这件事的东西:

image 1 --
            \
              ---> merged_image_12
            /
image 2 --

尽管这个问题在之前的两个进程中(1、2)被关闭了,但是当你想这么做时,这个问题仍然会产生。


如何合并两个Docker 镜像


那么,是否存在工具能够像这样做吗:docker merge image2 image2 merged_image


如何合并两个Docker 镜像


你甚至不可以用下面的方式来构建Dockerfile:

FROM image1
FROM image2

简而言之,在一个Dockerfile里不能有多个基础镜像。


如何合并两个Docker 镜像


唯一的解决办法是取得这些镜像的Dockerfile,然后把它们组织到一个文件中,再进行构建。那么,我能在Docker Hub上获得一个镜像的Dockerfile吗? 幸运的是可以。它不能离线获取(译注:原文是online,但显然online时对于来自Github的自动构建镜像是可以直接获取的),但是你可以使用docker history命令,通过反向工程获取。


如何合并两个Docker 镜像


在你的机器上使用docker pull从Docker Hub下载镜像。

docker pull image1
docker pull image2

然后使用docker history来取得构建这两个容器时运行的命令。

docker history --no-trunc=true image > image1-dockerfile
docker history --no-trunc=true image2 > image2-dockerfile

接下来打开这两个文件,你可以看到每个镜像的命令堆栈。这是因为Docker镜像通过层的方式来构建。即你在Dockerfile中键入的每一个命令所构建的新镜像,都是在之前的命令产生的镜像之上。所以你可以对镜像进行逆向工程。


如何合并两个Docker 镜像


你不能对镜像进行反向工程的唯一场景,是镜像的维护者在他的Dockerfile中使用了ADDCOPY命令。你会看到这样一行:

ADD file:1ac56373f7983caf22 
或 ADD dir:cf6fe659e9d21535844

这是因为你不知道维护者在他自己的机器上,包括镜像里使用了什么本地文件。


上一篇:张宵 20201112-1 每周例行汇报


下一篇:前端学习记录9