32、Swarm集群调度与服务发现全解析

最新推荐文章于 2025-11-24 13:48:09 发布

算法笑匠

最新推荐文章于 2025-11-24 13:48:09 发布

阅读量38

点赞数

CC 4.0 BY-SA版权

分类专栏： Docker实战精髓文章标签： Swarm 调度算法服务发现

本文链接：https://blog.youkuaiyun.com/1a2s3d4f5g/article/details/152568592

Docker实战精髓专栏收录该内容

33 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

Swarm集群调度与服务发现全解析

1. Swarm调度基础

在Swarm集群中，为确保所用镜像在每个节点上都被拉取，可以使用 pull 子命令。例如：

docker pull dockerinaction/ch12_painted

此命令会在每个节点上启动拉取操作，输出如下：

machine0-manager: Pulling dockerinaction/ch12_painted:latest... : downloaded
machine1: Pulling dockerinaction/ch12_painted:latest... : downloaded
machine2: Pulling dockerinaction/ch12_painted:latest... : downloaded

同样，移除容器会从其所在的机器上移除该容器，移除镜像则会从集群的所有节点上移除该镜像。Swarm隐藏了这些复杂性，让用户能专注于更重要的问题。

2. Swarm调度算法

Swarm提供了三种不同的调度算法，各有优缺点，在创建Swarm管理器时设置调度算法。用户可以通过为特定容器设置约束来调整调度算法。以下是三种调度算法的详细介绍：
| 算法名称 | 特点 | 适用场景 | 缺点 |
| ---- | ---- | ---- | ---- |
| Spread | 尝试将容器调度到未充分利用的节点上，均匀分配工作负载。通过资源使用情况和运行的容器数量对节点进行排名，选择资源最多且容器最少的节点运行新容器。 | 容器设置了资源预留且资源限制差异较小的情况。 | 当容器所需资源和节点提供的资源多样化时，可能导致新容器无法调度。 |
| BinPack | 优先充分利用每个节点的资源，使用最少的节点来支持工作负载。选择资源最繁忙但仍能满足容器需求的节点，即“最佳匹配”。 | 容器资源需求差异大或需要最小化集群规模并支持自动缩减的项目。 | 创建的关键节点数量少，增加了繁忙节点故障的可能性和故障影响。 |
| Random | 仅依靠概率从候选节点中选择，可能导致集群中同时存在繁忙节点和空闲节点。 | 对资源分布没有严格要求，希望系统自行处理各种可能性的情况。 | 无法保证工作负载的公平分配，可能出现热点或资源利用不充分的情况。 |

3. Spread算法详解

Spread算法会将工作负载均匀分布在集群的节点上。例如，在一个有三个相似节点的集群中调度三个大小相等的容器，每个容器会被放置在不同的主机上。当调度第四个容器时，三个机器中的任何一个都可能被选中，选中的机器将运行两个容器。调度第五个容器时，集群会在只运行一个容器的两个机器中选择。机器的选择排名由其运行的容器数量相对集群中其他机器的数量决定，运行容器少的机器排名更高。如果两台机器排名相同，则随机选择一台。

以下是使用Spread算法的示例：
1. 创建一个新的Compose环境描述文件 flock.json ，定义一个名为 bird 的服务：

bird:
  image: dockerinaction/ch12_painted
  command: bird
  restart: always

使用Compose扩展服务，观察Swarm如何在集群中分布10个 bird 服务副本：

docker-compose -f flock.yml scale bird=10 
docker ps

清理容器：

docker-compose -f flock.yml kill
docker-compose -f flock.yml rm –vf

4. 使用过滤器微调调度

在Swarm调度器应用调度算法之前，会根据Swarm配置和容器需求收集并过滤一组候选节点。可以使用 docker info 命令查看集群使用的活动过滤器。例如：

Filters: affinity, health, constraint, port, dependency

这些过滤器的作用如下：
- Affinity ：与另一个容器或镜像共置的要求。
- Constraint ：对机器属性（如内核版本、存储驱动、网络速度等）的要求。
- Dependency ：容器依赖关系，如链接或共享卷。
- Port ：将候选节点缩小到具有请求的主机端口可用的节点。

可以通过设置 docker-machine create 命令的 --engine-label 参数来为集群中的节点添加标签。例如：

docker-machine create -d virtualbox \
    --swarm \
    --swarm-discovery token://<YOUR TOKEN> \
    --engine-label size=small \ 
    little-machine
docker-machine create -d virtualbox \
    --swarm \
    --swarm-discovery token://<YOUR TOKEN> \
    --engine-label size=xxl \
    big-machine

容器可以使用环境变量来指定约束和亲和性规则。例如：

docker run -d -e constraint:size==xxl \ 
    -m 4G \
    -c 512 \
    postgres
docker run -d -e affinity:image==nginx \ 
    -p 80:80 \
    nginx
docker run -d -e affinity:image!=nginx \ 
   -p 8080:8080 \
    haproxy

mermaid流程图如下：

graph LR
    A[开始] --> B[收集候选节点]
    B --> C{是否通过过滤器}
    C -- 是 --> D[应用调度算法]
    C -- 否 --> B
    D --> E[调度容器]
    E --> F[结束]

5. BinPack和Random算法

BinPack算法优先充分利用每个节点的资源，使用最少的节点来支持工作负载。它需要知道容器的资源需求才能做出有效的调度决策，因此适用于为容器设置了资源预留的系统。例如，在一个有三个节点的集群中调度容器，BinPack算法会选择资源最繁忙但仍能满足容器需求的节点。

Random算法仅依靠概率从候选节点中选择，可能导致集群中同时存在繁忙节点和空闲节点。例如，在一个有三个节点的候选集中调度三个容器，可能会出现某个节点资源未充分利用但仍被跳过的情况。

6. Swarm服务发现

任何分布式系统都需要一种机制来定位其组件。在Docker中，单机Docker引擎的服务发现仅限于本地运行的容器，而Swarm项目的目标是提供一个“开箱即用”但可选的容器集群解决方案，其中一个重要的里程碑是在多主机环境中实现抽象的服务发现。

7. Swarm与单主机网络

Docker引擎在每个安装它的机器上的桥接网络后面创建本地网络。如果Swarm集群部署在使用单主机网络的Docker机器上，那么通过Swarm部署的容器只能发现同一主机上运行的其他容器。

以下是一个使用Coffee API示例测试的步骤：
1. 使用Git克隆Compose环境描述文件：

git clone git@github.com:dockerinaction/ch12_coffee_api.git

进入新目录并设置Docker环境指向Swarm集群：

cd ch12_coffee_api
eval "$(docker-machine env machine0-manager)"

使用Docker Compose启动示例：

docker-compose up -d

使用 docker CLI 查看新容器在集群中的分布：

docker ps

mermaid流程图如下：

graph LR
    A[开始] --> B[克隆项目]
    B --> C[进入目录并设置环境]
    C --> D[启动Compose环境]
    D --> E[查看容器分布]
    E --> F[结束]

通过合理选择调度算法和使用过滤器，可以优化Swarm集群的资源利用和性能。同时，理解Swarm的服务发现机制对于构建分布式应用至关重要。在实际应用中，需要根据具体的业务需求和系统特点选择合适的调度算法和服务发现方式。

Swarm集群调度与服务发现全解析

8. 服务发现机制对比

在分布式系统中，服务发现是一个关键问题。不同的服务发现机制各有优劣，以下是对Docker不同服务发现方式的对比：
| 服务发现方式 | 优点 | 缺点 | 适用场景 |
| ---- | ---- | ---- | ---- |
| 容器链接 | 简单易用，无需额外配置，可将静态配置注入容器的名称解析系统，使容器内应用无需感知运行环境。 | 仅限于单机环境，无法发现其他主机上的服务。 | 单机Docker环境，容器间依赖关系简单的场景。 |
| 设置默认DNS服务器 | 可使用任何暴露DNS接口的系统，灵活性高，能适应多主机环境。 | 需要额外配置DNS服务器，增加了系统复杂度。 | 多主机环境，需要统一的服务发现解决方案的场景。 |
| Swarm服务发现 | 提供抽象的服务发现接口，“开箱即用”，适用于集群环境。 | 依赖于Swarm项目的发展和完善，部分功能可能不够成熟。 | 大规模容器集群，需要统一管理和调度的场景。 |

9. 服务发现的重要性

服务发现对于分布式系统的正常运行至关重要。它可以帮助容器快速定位所需的服务，实现系统的高效协作。例如，在一个微服务架构的应用中，各个服务之间需要相互调用，如果没有有效的服务发现机制，服务之间的通信将变得非常困难。

10. 服务发现的实现步骤

以下是在Swarm集群中实现服务发现的一般步骤：
1. 选择服务发现机制 ：根据系统的需求和架构，选择合适的服务发现机制，如Swarm自带的服务发现、第三方DNS服务等。
2. 配置服务发现系统 ：如果选择第三方DNS服务，需要配置容器的默认DNS服务器和搜索域；如果使用Swarm服务发现，需要确保Swarm集群正常运行。
3. 注册服务 ：将服务注册到服务发现系统中，以便其他服务能够发现它。在Swarm中，容器启动时会自动注册到Swarm服务发现系统中。
4. 发现服务 ：服务在运行过程中，通过服务发现系统查找所需的其他服务。在Swarm中，容器可以通过服务名称直接访问其他服务。

mermaid流程图如下：

graph LR
    A[开始] --> B[选择服务发现机制]
    B --> C[配置服务发现系统]
    C --> D[注册服务]
    D --> E[发现服务]
    E --> F[结束]

11. 服务发现的注意事项

在使用服务发现时，需要注意以下几点：
- 可靠性 ：服务发现系统的可靠性直接影响到整个分布式系统的稳定性，因此需要选择可靠的服务发现机制和系统。
- 性能：服务发现的性能会影响到服务之间的通信效率，因此需要优化服务发现系统的性能。
- 安全性 ：服务发现系统需要保证服务信息的安全性，防止信息泄露和恶意攻击。

12. 总结

通过对Swarm调度和服务发现的深入了解，我们可以看到Swarm在容器集群管理方面的强大功能。在调度方面，Swarm提供了多种调度算法，如Spread、BinPack和Random，可以根据不同的场景选择合适的算法。同时，通过使用过滤器，可以进一步优化调度结果，提高集群的资源利用率。在服务发现方面，Swarm提供了抽象的服务发现接口，解决了多主机环境下的服务发现问题。

在实际应用中，我们需要根据系统的需求和特点，合理选择调度算法和服务发现机制。例如，如果系统的容器资源需求差异较小，且希望均匀分配工作负载，可以选择Spread算法；如果系统需要最小化集群规模并支持自动缩减，可以选择BinPack算法；如果对资源分布没有严格要求，可以选择Random算法。在服务发现方面，如果是单机环境，可以使用容器链接；如果是多主机环境，可以选择设置默认DNS服务器或使用Swarm服务发现。

总之，Swarm为我们提供了一个强大而灵活的容器集群管理解决方案，通过合理使用其功能，可以提高系统的性能和可靠性。

调度算法	特点	适用场景
Spread	均匀分配工作负载	容器资源需求差异小，希望均匀利用集群资源
BinPack	充分利用节点资源，使用最少节点	容器资源需求差异大，需要最小化集群规模
Random	随机选择节点	对资源分布无严格要求

同时，在使用Swarm时，还需要注意服务发现的可靠性、性能和安全性等问题，以确保整个分布式系统的稳定运行。

通过以上的介绍，相信大家对Swarm调度和服务发现有了更深入的了解，希望能够在实际项目中灵活运用这些知识，构建高效、稳定的分布式系统。