mirror of
https://github.com/yeasy/docker_practice.git
synced 2026-03-03 22:19:36 +00:00
64 lines
4.8 KiB
Go
64 lines
4.8 KiB
Go
## 4.7 实现原理
|
||
|
||
Docker 镜像是怎么实现增量的修改和维护的?为什么容器启动如此之快?这一切都归功于 Docker 的镜像分层存储设计。
|
||
|
||
### 镜像与分层存储
|
||
|
||
在之前的章节中,我们一直强调镜像包含操作系统完整的 `root` 文件系统,其体积往往是庞大的。因此在 Docker 设计时,就充分利用 **Union FS** 的技术,将其设计为分层存储的架构。
|
||
|
||
Docker 镜像并不是一个单纯的文件,而是由一组文件系统叠加构成的。
|
||
|
||
最底层的镜像称为 **基础镜像(Base Image)**,通常是各种 Linux 发行版的 root 文件系统,如 Ubuntu、Debian、CentOS 等。
|
||
|
||
当我们在基础镜像之上构建新的镜像时(例如安装了 Nginx),Docker 并不是复制一份基础镜像,而是在基础镜像之上,**新建一个层(Layer)**,并在该层中仅记录为了安装 Nginx 而发生的文件变更(添加、修改、删除)。
|
||
|
||
这种分层存储结构使得镜像的复用、分发变得非常高效:
|
||
|
||
* **复用**:如果多个镜像都基于同一个基础镜像(例如都基于 `ubuntu:24.04`),那么宿主机只需要下载一份 `ubuntu:24.04`,所有镜像都可以共享它。
|
||
* **轻量**:镜像仅仅记录了与基础镜像的差异,因此体积非常小。
|
||
|
||
### 容器层与读写
|
||
|
||
我们要理解的一个关键概念是:**镜像的每一层都是只读的(Read-only)**。
|
||
|
||
那么,既然镜像只读,容器为什么能写文件呢?
|
||
|
||
当容器启动时,Docker 会在镜像的最上层,添加一个新的**可写层(Writable Layer)**,通常被称为**容器层**。
|
||
|
||
```
|
||
┌──────────────────────────────────────────────┐
|
||
│ 容器层 (可写, Writable Container Layer) │ <-- 所有的写操作都在这里
|
||
├──────────────────────────────────────────────┤
|
||
│ 镜像层 (只读, Read-only Image Layer) │
|
||
├──────────────────────────────────────────────┤
|
||
│ 镜像层 (只读, Read-only Image Layer) │
|
||
├──────────────────────────────────────────────┤
|
||
│ 基础镜像层 (只读, Base Image Layer) │
|
||
└──────────────────────────────────────────────┘
|
||
```
|
||
|
||
* **读取文件**:当容器需要读取文件时,Docker 会从最上层(容器层)开始向下层(镜像层)寻找,直到找到该文件为止。
|
||
* **修改文件**:当容器需要修改某个文件时,Docker 会从下层镜像中将该文件复制到上层的容器层,然后对副本进行修改。这被称为 **写时复制(Copy-on-Write, CoW)** 策略。
|
||
* **删除文件**:当容器删除某个文件时,Docker 并不是真的去下层删除它(因为下层是只读的),而是在容器层创建一个特殊的“白障(Whiteout)”文件,用来标记该文件已被删除,从而在容器视图中隐藏它。
|
||
|
||
这就是为什么:
|
||
|
||
1. **容器删除后数据会丢失**:因为所有的数据修改都保存在最上层的容器层中,容器销毁时,这个层也就随之销毁了。(除非使用了数据卷,详见[数据管理](../08_data_network/README.md))。
|
||
2. **镜像不可变**:无论我们在容器里删除了多少文件,基础镜像的体积并不会减小,因为它们依然存在于底层的只读层中。
|
||
|
||
### 内容寻址与镜像 ID
|
||
|
||
Docker 镜像的每一层都有一个唯一的 ID,这个 ID 是根据该层的内容计算出来的哈希值(SHA256)。这意味着:
|
||
|
||
* **内容即 ID**:只要层的内容有一丁点变化,ID 就会变。
|
||
* **安全性**:确保了镜像内容的完整性,下载过程中如果数据损坏,ID 校验就会失败。
|
||
* **去重**:如果两个不同的镜像(甚至是不同来源的镜像)包含相同的层(ID 相同),Docker 引擎在本地只会存储一份,绝不重复下载。
|
||
|
||
### 联合文件系统 (Union FS)
|
||
|
||
Docker 使用联合文件系统(Union FS)来实现这种分层挂载。常见的驱动包括 `overlay2`(目前推荐)、`aufs`(早期使用)、`btrfs`、`zfs` 等。
|
||
|
||
虽然实现细节不同,但它们都遵循上述的 **分层 + CoW** 模型。
|
||
|
||
> 想要深入了解 Overlay2 等文件系统的具体实现原理,包括 WorkDir、UpperDir、LowerDir 等底层细节,请阅读 **[第十四章 底层实现](../14_implementation/README.md)** 中的 **[联合文件系统](../14_implementation/14.4_ufs.md)** 章节。
|