边缘云连续体中基于意图的人工智能增强型服务编排助力应用部署与执行
1. 引言
在当今的云连续体(CC)时代,应用部署和执行面临着诸多挑战。当代应用来源广泛,硬件和环境要求多样,应用所有者的目标和意图也各不相同。这使得选择和配置具有不同特性与能力的计算资源,以满足应用的技术和业务需求变得极为复杂,且这一过程大多依赖手动操作,效率低下。同时,当应用所有者需要重新分配计算资源时,操作也十分困难。
SERRANO 项目采用的分层架构简化了这一过程,使基于意图的服务编排成为可能。其中,AI 增强型服务编排器(AISO)作为 SERRANO 平台架构上层的主要组件,负责将应用所有者的意图转化为资源需求,而资源编排的技术细节则由平台的下层组件,特别是资源编排器(RO)处理。中央遥测处理程序(CTH)负责收集和管理资源产生的遥测数据。
2. 相关工作与背景知识
2.1 基于意图的服务编排
基于意图的应用需求描述,让用户能以最高抽象级别表达应用部署和执行的目标,而非具体的技术细节,从而便于 CC 编排组件自动配置和使用资源,满足用户意图。以下是一些相关系统和框架:
-
基于意图的网络(IBN)系统
:用于 5G 移动网络,由应用层、管理层和物理层组成。应用层的基于意图的管理系统(IMS)将服务质量(QoS)合同转化为管理层的配置,物理层包含多个虚拟网络功能(VNF)。
-
基于意图的云安全服务(IBCS)系统
:使安全服务提供商和消费者能在无需安全专家的情况下设置安全策略。消费者先以抽象方式表达安全策略意图,IBCS 将其转化为具体的低级策略,用于检测合适的网络安全功能(NSF)并创建实例。
-
基于意图的云管理框架
:弥合云用户的“服务级别”需求与云提供商对特定云资源需求之间的差距。通过收集云环境的性能日志训练回归模型,以找到满足用户性能意图的资源配置。
然而,这些系统和框架假定应用已开发完成,且在使用特定硬件加速器(如 GPU 和 FPGA)时,往往需要额外的编程工作。此外,在没有预定义虚拟机(VM)或容器映像的情况下,应用内部组件的自动部署和重新配置也十分复杂。
2.2 机器学习和数据挖掘技术
机器学习(ML)和数据挖掘(DM)技术可让软件代理从数据中学习并建模复杂系统行为,主要分为监督学习和无监督学习(如聚类方法)两类。以下是一些常见的技术:
|技术类型|具体技术|描述|
| ---- | ---- | ---- |
|监督学习|线性/逻辑回归、高斯判别分析(GDA)模型|特殊的广义线性模型和生成学习算法|
|监督学习|贝叶斯网络|概率图网络,用于表示变量及其关系,最简单的是朴素贝叶斯网络|
|监督学习|决策树|树状结构,用于数据分类,组合多个决策树(随机森林)可提高性能|
|监督学习|支持向量机(SVM)|旨在开发超平面分离数据,适用于二分类问题,结合核方法可处理非线性可分数据|
|无监督学习|聚类方法|如层次聚类和 K - 均值聚类,用于在高维数据中寻找模式|
|无监督学习|密度模型(如 DBSCAN)|将数据点分组为密集且相连的区域|
|无监督学习|频繁模式挖掘技术|如 FP - Growth 算法,用于发现数据中的模式或关联规则|
|神经网络|人工神经网络(NNs)|包含多个相互连接的人工神经元,可处理高维数据并发现复杂模式|
|神经网络|卷积神经网络(CNNs)|一种特殊的深度前馈神经网络,具有稀疏交互|
|神经网络|循环神经网络(RNNs)|具有记忆功能,特殊类型包括长短期记忆网络(LSTM)和门控循环单元(GRU)|
这些技术对于 AISO 的设计至关重要,可帮助其从收集的数据中提取有用模式,驱动编排过程。同时,ML/DM 技术也可能是应用本身的重要组成部分,因此需要合理配置和使用资源,以满足应用级别的需求。
3. 采用的方法
3.1 概述
应用的成功部署和计算机资源的高效使用取决于多个参数,包括 CC 资源的能力和可用容量、应用的特定需求、用户的目标和意图以及优先级。为实现应用的自动部署,开发了一个框架,利用 AI 技术处理应用模型(AM)、资源模型(RM)和遥测数据模型(TM)之间的复杂关系。
AISO 负责编排过程的第一部分,并与 RO 合作进行应用的正确部署。为此,指定了多个映射规则(MRs),用于将初始的抽象参数转换为中间或低级参数,以便 RO 用于应用的部署、执行和监控。此外,还定义了额外的 MRs,用于将 CTH 捕获的遥测数据与相关的 AM 实体关联起来,以衡量用户初始需求的满足程度。
3.2 抽象模型
应用模型(AM)
AM 从用户的角度为软件应用的正式描述提供了术语,包括应用应满足的特定要求以及用户的目标和意图。该模型的设计受安全、金融和制造等领域的应用案例驱动,采用多层次的结构化格式,有助于翻译过程。模型参数的值可以是数字、布尔值或术语。
以下是 AM 的部分内容:
|类别|子类别|参数|
| ---- | ---- | ---- |
|使用需求|用户数量|并发用户总数|
|性能|执行|总执行时间|
|硬件加速|GPU / FPGA| - |
|数据存储|容量|容量大小|
|安全存储|数据加密算法、擦除编码方案| - |
|位置|地理位置、与最终用户的接近程度| - |
|网络|网络容量、上传/下载带宽、网络延迟、消息加密算法| - |
|能源|总能耗| - |
|成本|总成本| - |
为了正式表达应用需求和用户意图,采用了基于模型的方法,根据 AM 中的参数和可能的值指定约束条件。用户还可以定义约束条件的重要性、适用范围以及内部组件之间的关系。此外,应用所有者还需提供部署描述,包含 RO 部署应用所需的低级技术细节。
资源模型(RM)
RM 识别硬件属性和与实体交互的定义。独立资源具有计算能力,可通过 SSH、REST 等接口进行遥测数据收集、资源配置和执行。独立资源包括硬件和软件资源,硬件资源以节点为基础,节点可以是边缘设备、虚拟机或裸金属服务器,并可附带 GPU、FPGA 等资源。软件资源聚合硬件资源并提供功能设施,如存储服务和执行服务。
graph LR;
A[独立资源] --> B[硬件资源];
A --> C[软件资源];
B --> D[节点];
D --> E[边缘设备];
D --> F[虚拟机];
D --> G[裸金属服务器];
D --> H[附加资源];
H --> I[GPU];
H --> J[FPGA];
H --> K[SmartNICs];
H --> L[DPUs];
C --> M[存储服务];
C --> N[执行服务];
M --> O[存储位置];
遥测数据模型(TM)
TM 捕获平台各组件的基础设施运行时测量数据,数据分为计算、内存、磁盘、网络和硬件信息五大类,每类又进一步细分为子类别,以充分描述可分配的硬件和软件组件的状态。
3.3 映射规则(MRs)
映射规则(MRs)在整个应用部署和执行过程中起着关键的桥梁作用,它负责将抽象的应用需求转化为具体的资源配置信息,实现不同模型之间的有效衔接。以下是 MRs 的详细介绍:
-
应用模型到资源模型的映射
:这一映射过程将 AM 中的抽象参数转化为 RM 中可操作的硬件和软件属性。例如,AM 中对 GPU 加速的需求,通过 MRs 转化为 RM 中对具有 GPU 资源的节点的选择和配置。具体步骤如下:
1.
参数提取
:从 AM 中提取与资源相关的参数,如硬件加速需求、数据存储容量等。
2.
规则匹配
:根据预定义的 MRs,将提取的参数与 RM 中的资源属性进行匹配。
3.
资源选择
:根据匹配结果,从可用资源中选择满足应用需求的资源。
4.
配置生成
:生成资源的配置信息,如节点的 CPU 核心数、内存大小等。
-
遥测数据到应用模型的映射
:此映射用于将 CTH 收集的遥测数据与 AM 中的实体关联起来,以便衡量应用需求的满足程度。具体步骤如下:
1.
数据收集
:CTH 收集平台各组件的遥测数据,包括计算、内存、磁盘等方面的信息。
2.
数据处理
:对收集到的遥测数据进行清洗、整理和分析。
3.
规则匹配
:根据 MRs,将处理后的遥测数据与 AM 中的参数进行匹配。
4.
需求评估
:根据匹配结果,评估应用需求的满足程度,并生成相应的报告。
3.4 AI 增强型服务编排器(AISO)
AISO 作为整个系统的核心组件,承担着将应用所有者的意图转化为资源需求,并协调资源编排过程的重要任务。为了实现这一目标,AISO 集成了创新的算法和 AI 技术,具体如下:
-
意图理解
:AISO 首先需要理解应用所有者以 AM 形式表达的意图。这涉及到对 AM 中参数和约束条件的解析和分析,以确定应用的具体需求。
-
资源优化
:根据理解的应用意图,AISO 利用 AI 技术对可用资源进行优化分配。例如,使用机器学习算法预测应用的资源需求,从而选择最合适的资源进行部署。
-
编排协调
:AISO 与 RO 进行紧密协作,协调应用的部署和执行过程。它根据资源的可用性和应用的需求,制定合理的编排计划,并确保计划的顺利执行。
-
实时监控
:AISO 实时监控应用的执行情况和资源的使用情况,根据监控结果及时调整编排策略,以确保应用的高效运行。
4. 实际应用与效果
为了验证所提出的方法的有效性,将其应用于数据和计算密集型应用的部署和执行中。以下是具体的应用场景和取得的效果:
4.1 应用场景
选择了安全、金融和制造等领域的多个应用案例进行测试,这些应用具有不同的需求和特点,能够充分检验系统的通用性和适应性。例如:
-
安全应用
:对大量的安全数据进行实时分析和处理,需要高计算能力和低延迟的网络环境。
-
金融应用
:处理复杂的金融交易和数据分析,对数据的安全性和准确性要求较高。
-
制造应用
:实现生产线的自动化控制和优化,需要与物理设备进行实时交互。
4.2 应用效果
通过实际应用,取得了以下显著效果:
|效果指标|具体描述|
| ---- | ---- |
|资源利用率提高|通过优化资源分配,显著提高了资源的利用率,减少了资源的浪费。|
|应用性能提升|应用的执行时间明显缩短,响应速度加快,满足了用户对性能的要求。|
|用户满意度增加|用户能够更方便地表达自己的意图,系统能够自动满足用户的需求,提高了用户的满意度。|
5. 总结与展望
5.1 总结
本文提出了一种基于意图的 AI 增强型服务编排方法,用于解决云连续体中应用部署和执行的挑战。通过开发 AM、RM 和 TM 等抽象模型,以及利用 AI 技术和 MRs,实现了应用需求的自动转化和资源的优化分配。实际应用结果表明,该方法能够显著提高资源利用率和应用性能,满足用户的多样化需求。
5.2 展望
未来的研究方向可以从以下几个方面展开:
-
扩展模型的适用性
:进一步扩展 AM、RM 和 TM 的适用范围,使其能够涵盖更多类型的应用和资源。
-
优化 AI 算法
:不断优化 AISO 中使用的 AI 算法,提高其对复杂应用需求的理解和处理能力。
-
加强与其他系统的集成
:将该系统与其他相关系统进行集成,如物联网平台、大数据分析系统等,实现更广泛的应用场景。
-
提高系统的安全性
:加强系统的安全性,保护应用和用户数据的安全,防止数据泄露和恶意攻击。
通过不断的研究和改进,相信基于意图的 AI 增强型服务编排方法将在云连续体领域发挥更大的作用,为用户提供更加高效、智能的应用部署和执行解决方案。
超级会员免费看
1378

被折叠的 条评论
为什么被折叠?



