Apache Heron中的First Fit Decreasing资源打包算法解析

伍霜盼Ellen

于 2025-06-11 09:01:42 发布

阅读量223

点赞数 5

CC 4.0 BY-SA版权

本文链接：https://blog.youkuaiyun.com/gitblog_00277/article/details/148575115

Apache Heron中的First Fit Decreasing资源打包算法解析

incubator-heron Apache Heron (Incubating) is a realtime, distributed, fault-tolerant stream processing engine from Twitter 项目地址: https://gitcode.com/gh_mirrors/incu/incubator-heron

算法概述

First Fit Decreasing（FFD）是一种经典的装箱算法，在Apache Heron分布式流处理系统中被实现为资源打包策略。该算法的主要目标是通过优化实例在容器中的分布，最大限度地减少资源浪费，同时确保每个实例都能获得其所需的计算资源。

适用场景

FFD打包算法特别适合以下三种业务场景：

自动容器数量确定：当用户不确定应该为拓扑分配多少个容器时，FFD算法可以根据资源需求自动计算最优容器数量。
资源利用率优化：算法会尽可能减少容器数量，从而降低系统整体资源消耗。因为每个额外容器都会启动一个流管理器进程，减少容器数量意味着减少系统开销。
资源保障需求：算法确保每个实例获得的RAM资源不会低于组件配置或默认值，为关键业务提供资源保障。

核心参数解析

FFD算法的运行依赖于六个关键参数：

组件RAM需求：定义每个组件实例的内存需求，未指定时默认1GB
容器最大RAM提示：单个容器允许的最大内存使用量
容器最大CPU提示：单个容器允许的最大CPU核心数
容器最大磁盘提示：单个容器允许的最大磁盘空间
填充百分比：为系统进程预留的资源比例
组件并行度：决定每个组件的实例数量

算法工作原理

FFD算法的工作流程可以分为四个阶段：

资源需求排序：首先将所有实例按照RAM需求从大到小排序
容器选择策略：依次处理每个实例，将其放入第一个能满足其资源需求的容器中
容器扩容机制：如果没有合适容器，则创建新容器
资源填充处理：在所有实例分配完成后，为每个容器添加额外的系统资源缓冲

值得注意的是，如果某个实例的RAM需求超过了配置的最大容器RAM限制，算法会返回空打包方案。

配置实践指南

基础配置示例

在拓扑配置中启用FFD算法：

heron.class.packing.algorithm: com.twitter.heron.packing.binpacking.FirstFitDecreasingPacking

Java API配置

// 创建拓扑配置对象
com.twitter.heron.api.Config topologyConfig = new com.twitter.heron.api.Config();

// 设置容器最大RAM为10GB
long maxContainerRam = 10L * Constants.GB;
topologyConfig.setContainerMaxRamHint(maxContainerRam);

// 设置填充百分比为5%
topologyConfig.setContainerPaddingPercentage(5);