基于特征工程的边缘服务建模

基于特征工程的机会主义边缘计算系统服务建模

摘要

边缘计算系统运行的机会性上下文带来了不同的挑战,特别是在用户移动性方面,如资源管理与系统编排、实时响应能力以及性能质量需求。基于此,我们提出了一种用于建模机会主义边缘计算服务的新型开发过程,该过程依赖于 (i) ETSI MEC参考架构和机会主义物联网建模方法,用于系统分析与设计的早期阶段,即领域模型和服务元模型;以及(ii)特征工程,以选择关键的机会性特征,从而实现分布式、高效且有效的多接入边缘计算服务。我们通过在多接入边缘计算系统中展示一种基于微服务的移动性管理服务来进行在线分析,以示例说明所提出的开发过程。为了分析用户移动性的特性(即接入点之间的切换),我们在分析阶段利用领域知识,在真实世界数据集中自动构建面向边缘的机会性特征向量,并初步识别出一部分机会性特征。对这些向量进一步应用数据分析和机器学习技术是直接可行的,有助于应对此类用例服务开发中的机会性(以及由此带来的不可预测性和复杂性),并普遍适用于边缘计算系统的开发。

关键词 :多接入边缘计算, 机会主义计算, 服务建模, 用户移动性, 特征工程

1. 引言

5G网络作为未来无线通信基础设施的推动者,正在全球范围内进行商业部署。对于物联网(IoT)系统,5G技术能够提供网络特征例如低延迟、高带宽和可靠性。然而,由于在网络边缘进行数据采集与在云端进行计算之间存在较大的地理距离,并且依赖大规模上行物联网数据传输,基于云的集中式物联网系统无法满足实时计算或数据密集型应用的需求。边缘计算[1]作为一种下一代分布式计算解决方案应运而生,通过将云资源下沉至网络边缘,即靠近用户设备(UE,例如智能手机、笔记本电脑或其他联网终端设备)的基础设施组件。在此背景下,欧洲电信标准协会(ETSI)正主导着标准化工作,推动一种称为多接入边缘计算(MEC)的参考边缘计算系统架构[2, 3]。以MEC为例,蜂窝网络基站被复用为虚拟化应用的内容处理、共享与存储平台,同时提供实时无线网络信息,以优化平台资源使用。除了潜力之外,5G和边缘计算技术也带来了显著挑战,这些挑战与在5G连接之上实现大规模分布式计算的复杂性相关。在大规模环境下,由于用户移动性和运行环境带来的机会性元素、动态数据流量以及应用资源有限等问题,均要求在靠近UE的实时邻近区域中,采用人工智能和机器学习(ML)解决方案来实现服务提供以及边缘资源的编排与管理[3, 4, 5]。鉴于整个场景的总体复杂性,建模活动对于明确和可视化边缘计算系统的结构与行为(无论是现有系统还是期望中的系统)至关重要。实际上,模型能够以可调节的抽象与细节层次,为整个开发过程中不同利益相关者提供指南。

基于上述前提,本文提供了一种开发过程,该过程结合图形表示(即元模型)和统计方法(即特征向量),用于对边缘计算服务进行建模,同时应对边缘计算系统的机会主义特性。特别是,我们将机会性物联网服务建模[6]方法应用于 ETSI MEC参考架构,以提供一种面向MEC的新型服务配置文件与模型。通过利用特征工程,识别影响系统的关键因素(如系统属性或配置参数),有助于应对由与边缘计算相关的元素引入的机会主义(以及由此带来的不可预测性与复杂性)。据我们所知,目前尚未提出过此类用于边缘计算系统开发的方法。为了验证该方法,我们对一个示例MEC服务——移动性分析服务进行了建模,在该服务中,一组关于用户移动的机会型服务特征(在建模阶段由领域专家协助识别,并组织为面向边缘的机会主义特征向量,简称OFVE)通过皮尔逊相关性进一步自动优化。最后,我们展示了所获得的知识如何有助于简化此类机会型移动服务以及一般边缘计算系统的设计与实现。

示意图0

2. 背景

2.1. 边缘计算挑战与机会性元素

边缘计算[1]将云 -以物联网计算资源为中心,朝着大规模地理分布的架构发展。在边缘,服务器和数据中心被部署在移动用户附近,利用蜂窝基站和接入点(AP)等网络基础设施。主要的边缘计算架构由功能强大的服务器组成,这些服务器与移动网络基础设施共存,但也可以在现有的基于位置的硬件上部署额外的边缘资源,从而提供更进一步的中间层,类似于雾计算[7]。通常,聚类算法如[8],被用于优化边缘服务器的部署,即在多个接入点之间合理布置有限数量的服务器。通常认为边缘服务器性能强大,能够为多个接入点提供服务,但在雾计算中,每个接入点可以在本地配备一个或多个小规模计算平台。

基于这些基础,边缘计算范式相较于以云为中心的物联网系统,在用户、第三方应用开发者方面 promise 显著改进服务提供商和网络运营商。首先,为用户提供专用资源,以将其数据密集型应用卸载到附近的边缘平台。其次,用户在与边缘应用和服务交互时可获得更高的带宽和低延迟。第三,在核心网络中,数据传输负载和延迟得以降低,因为数据已在边缘平台的一跳距离内完成处理。第四,系统编排和资源管理分布在部署架构中,从而提高了对固有的动态物联网系统和网络的适应性、反应性、上下文感知和响应性。因此,最能从边缘范式中受益的物联网应用是(i)具有高计算和存储需求的应用,(ii)产生大量网络流量的应用,以及(iii)需要低延迟和实时交互的应用。

关于边缘计算的优势,其机会性特性及其根本原因已被广泛认可。边缘端的这些挑战大体上源于与物理底层网络相关的产物和元素、大规模分布式计算的资源可用性、应用需求以及系统设计与实现的副产品。此后,我们将报告有关边缘计算系统中机会性特性的根本原因的关键发现,如 [3, 6, 9, 10, 8, 11, 12, 13, 14, 15, 16] 中所讨论的。

用户与设备 。边缘计算的需求源于用户设备的局限性,这些设备不断需要更高的处理能力和数据量,以满足各种应用类型的体验质量(QoE),例如实时视频流。此外,不可预测的用户移动和交互行为使得依赖多种通信技术的用户设备难以维持网络连接。

应用 。边缘应用要么从用户设备卸载,要么通过拉取请求部署到边缘平台,形式为虚拟机或容器。虚拟机将应用封装为自包含包,其尺寸可能较大。由于软件的内部复杂性,这可能导致大规模应用的灵活性较差。此外,此类组件的实例化、部署和迁移耗费资源,限制了其可扩展性。另一方面,容器封装了一个微服务,而该微服务又实现单一功能。一组微服务共同实现所需的应用/服务逻辑。其优势在于,由于每个微服务都有大量可用的边缘组件,部署选项更加多样化,从而解决了可扩展性问题。然而,此类分布式应用的在线组合与编排、固有的通信延迟以及可能发生的故障处理具有挑战性。

系统与平台 。为了在存在机会性元素的情况下实现边缘计算承诺,需要持续地 “在正确的时间到达正确的位置”供应特定应用的边缘资源,以确保在整个边缘部署中提供足够的用户体验质量,即使在伴随高数据流量的高峰期也能如此。在这个方向上,边缘平台发挥着关键作用:它们是作为基础的大规模开放分布式系统,充当(i)中间件,用于引导数据流量并互连特定应用的组件,以及(ii)应用执行平台,用于向系统组件和应用实时提供系统服务。边缘平台的部署受限于运营商预算,并部署在现有核心网络之上,其拓扑结构决定了边缘系统组件的放置位置。特别是,边缘平台处理横向和纵向特定应用的网络流量。前者由系统组件之间的协作产生,受网络拓扑和链路容量制约,决定了最大数据传输限制;后者由依赖所有系统层进行应用执行的应用产生,需要用户设备、边缘组件与云之间的信息交换。

编排与管理 。以集中式方式对边缘平台进行编排与管理会不可避免地在其操作中引入延迟,因为有关系统性能的信息在系统中分散且快速更新。因此,为了实现优化性能和用户体验质量(QoE),边缘平台组件需要具备响应性和自适应性来处理机会性特性。为应对用户移动性,应用组件和服务需要在运行时于系统中重新定位,这需要多个系统组件之间的协作与决策。在此过程中,自动化决策、服务组合、系统策略执行、负载均衡和冲突解决需要结合上下文感知信息,但由于大规模运行数据对计算能力的高需求,这些功能通常部署在云端,以便实时提供对整个系统的视图。为提高适应性和反应性,MEC平台组件被设计为在决策上部分自主,但需向系统管理提供其操作的反馈。在此场景下,自动化解决方案提供的帮助有限,例如机器学习(ML)算法能够处理超出人类理解能力的大规模数据,并为运营商提供例如预测等功能。

2.2. 多接入边缘计算系统参考架构

下文将简要介绍ETSI MEC参考架构,该架构适用于边缘计算系统,并在后续章节中涉及边缘服务建模。有关MEC参考架构、系统组件、其功能及交互的详细信息,请参见ETSI文档1。

MEC标准化的目的是为不同的利益相关者(如移动网络运营商、供应商、服务提供商和第三方开发者)提供一个开放的多厂商边缘计算平台。这些标准提供了在参考架构基础上实现MEC系统以及实现系统服务的指南,以确保在边缘部署和应用领域中的一致性操作。该标准规定了一组应用程序编程接口(API),提供系统组件之间详细的交互模式和互操作性。APIs 涉及系统管理与授权、应用使能、部署与生命周期、移动性管理以及系统性能监控。此外,标准还定义了概念验证应用以及用于评估边缘系统性能的功能性和非功能性关键性能指标(KPI)集合。

ETSI MEC系统架构将网络基础设施组件的作用从转发网络流量扩展到缓存和共享内容以及运行服务和应用。MEC系统参考架构[17]如图2所示。MEC应用由移动用户请求或第三方开发者和/或服务提供商发起,后者通过按需启动服务、创建应用上下文描述并指定服务的使用策略和计费信息等来实现。MEC系统操作分为系统级和主机级。一组系统服务在两个层级上支持分布式管理,包括系统资源管理以及在边缘虚拟化基础设施之上的MEC平台中的应用使能、部署和生命周期管理。这些系统服务提供并依赖于关于系统状态、资源使用和本地网络条件的实时信息。在 MEC应用开发方面,ETSI将MEC应用建模为一组自治且松耦合的微服务[18]。

在系统级,集中式编排器对系统服务和平台管理具有可见性和权威性。MEC应用的实例化和执行由编排器管理,基于用户请求创建的应用上下文进行。请求将被验证,并根据主机中的资源可用性(包括应用负载、可用服务和延迟)对上下文进行必要的调整。虚拟化的应用包及所需服务将在选定的主机根据硬件要求和网络资源进行操作。在此过程中,编排器掌握服务属性、配置和依赖关系、使用策略以及计费信息。根据用户请求或自身决策,编排器会触发应用的迁移和终止。应用重定位过程在[19],中由应用移动性服务执行。

在主机管理层面,MEC平台管理一组MEC主机。平台管理器控制应用生命周期,并解决与数据流量和服务使用相关的资源冲突。该管理器还收集关于自身性能的实时信息。同时,平台的虚拟化管理器为应用和服务分配虚拟化资源。

MEC主机在其自身的虚拟化基础设施之上,为托管的应用和服务提供计算、网络和数据存储资源。主机支持多接入技术以连接到本地网络,并能够处理多个用户设备的请求和数据流量。这种多租户模式需要共享平台资源、服务以及应用实例。

MEC主机提供服务注册表,以实现跨平台的服务发现、访问、提供和发布。

示意图1

2.3. 物联网系统与服务的建模

如[14, 20, 21],所述,物联网应用的开发提出了特定的需求,这些需求大多与传统软件工程正交,包括异构系统组件间的互操作性、大规模分布式部署的可扩展性、安全性和隐私保护方案、以及软连续性和硬件可演化性。

然而,从分析到设计阶段,并涵盖此类应用的编程抽象和软件结构的统一的方法论仍有待形成。特别是,分析活动有助于减轻软件开发负担和缩短开发时间,同时提高软件质量。通过对应用需求、系统组件、其功能、内部及相互关系、组织结构和约束进行操作建模,可以有效表示一系列软件架构模型。同时,非功能性需求(如质量属性、系统策略、维护指南和系统演进)可以在进入实施阶段之前,以非正式或正式的方式表达,用于后续的验证、确认和仿真。

在此方向上已经迈出了一些步伐,通常采用模型驱动工程(MDE)的原则用于物联网系统和应用软件开发,如[22, 23, 24, 25]中所示。第一类研究工作集中在物联网系统的概念级高层建模。例如,文献[26]提出了一种在物联网系统的不同层次采用不同建模方法的统一建模解决方案。文献[27, 28, 29, 30],提出了面向物联网的元模型,旨在通过标准化工作流和本体提供概念表示。这些研究虽然考虑了物联网系统的元素的全局视图,但所提供的建模方法主要针对静态环境已建立的交互和分层系统架构,很大程度上被忽视的机会特性[14, 15]。另一类研究仍关注物联网的建模活动,侧重于专门为边缘计算系统和服务定制的方法。例如,蔡等人 [31]关注在物联网动态环境中进行移动应用建模,从而定义服务组件以在线配置此类服务。在 [6]中提出了一种完整的工程方法——从分析到仿真——用于物联网边缘复杂机会性与协作性服务,该方法利用了聚合计算的优势。关于认知物联网系统的设计与建模在 [32, 33],中已有探讨,重点在于系统的反应性、主动性和认知行为以及通过设计模型的精细化实现在线自适应。针对物联网系统非功能性及服务质量属性的建模已在 [34, 35, 36, 37]中得到研究。

本次关于物联网系统和服务建模的简要文献综述的关键发现如下:模型驱动工程方法在支持边缘计算等复杂系统的整个开发过程中尤为有效。事实上,建模活动被广泛认为是简化后续开发步骤的基石。技术知识边缘和领域知识在分析和设计阶段就已融入,能够提高对开发挑战的认知,并有助于在实现、部署和维护的后续阶段产生更优的解决方案。以边缘技术、系统和移动网络的领域知识为例,可为预期性能、网络拓扑提供有价值的见解。技术和部署选项、可靠性和隐私问题,这些通常难以捕捉。因此,为了系统地应对物联网环境固有的机会性特征,最合适的方法是采用一种系统且全面的方法,依赖于模型驱动工程以及技术和领域知识。

2.4. 机会性建模的特征工程

应用机器学习为分析、学习和预测边缘计算系统的属性、操作和性能提供了一套强大的工具。为了实现机器学习的优势,数据分析师需要承担为目标问题设置工具的关键而精细的过程,包括确定需要考虑的相关变量和数据、选择最适合主要系统属性的模型,以及最终选用正确的学习算法。随后进行模型评估与调优,再决定如何呈现结果。

这些在机器学习建模之前的准备工作通常被称为特征工程[38, 39],,即“从原始数据中提取特征并将其转换为适合机器学习模型的格式的过程”。因此,特征工程的目的是通过准备对特定问题有意义的输入数据,并设计出能有效表征潜在问题的一组合适特征,从而降低机器学习建模的难度。这样一来,机器学习模型完成任务的能力和/或其准确性可以增加。在实践中,特征工程难以泛化,通常被模糊地描述为“技巧集合” [38]。

然而,通常情况下,特征工程过程包括以下步骤。第一步是问题定义,包括描述目标(s)并找到相关数据,这通常需要领域专家和数据分析师之间的协作。第二步是数据预处理,即将数据预处理并转换为数学机器学习工具易于处理的格式,例如以特定问题的特征向量形式表示的数值型和分类变量。第三步是特征集的设计,即特征提取,旨在恰当地表示底层问题并描述数据中的内在结构。在此阶段,自动机器学习工具提供了从数据中提取大量简单统计特征的方法,但存在导致高维特征空间的风险。另一种方法是利用领域知识提取和构建额外的特征集,例如可以融入上下文知识。因此,第四步是使用特征选择技术(如[39],中所述)来降低特征空间的维度。通常,此步骤可提高数据质量,得到更简单的模型、更易于解释和维护的数据集,并提升算法效率、可追溯性和有效性。然而,特征选择通常是实验性和迭代性的,并且高度依赖于上下文,因为特征的意义仅相对于当前的数据、模型和任务而言才是有意义的[38]。

本文中,我们利用第4节中概述的特征工程流程,针对多接入边缘计算系统中与用户移动性相关的机会性特性进行展示和分析。

3. 多接入边缘计算的机会式服务建模

旨在填补高层服务建模与通过数据分析评估边缘系统中机会性特征之间的空白,我们提出了一种遵循欧洲电信标准协会规范的多接入边缘计算综合物联网服务建模方法。本文后续介绍的服务开发过程遵循模型驱动工程原则,重点在于概念模型的逐步细化,分别在分析阶段(技术无关的机遇式物联网服务模型)、设计阶段( MEC规范作为边缘系统的架构)以及实现阶段(MEC规范作为服务实现的标准)进行。该过程如图3所示。本章节中,我们将重点关注开发过程中的分析与设计部分。

3.1. 多接入边缘计算的领域模型

根据机会性物联网服务建模[6],,我们识别出需要建模的通用物联网系统的主要元素:(i)物联网实体,其被分类为物联网设备、用户和代理,它们通过与环境交互提供和使用服务,(ii)服务,通过启用原子或组合的配置和应用来实现系统中的功能,(iii)上下文,用于整合从应用中得出的领域和系统特定信息,(iv)环境,即动态且复杂的物理物联网系统环境,该环境对实体和服务在可用资源条件下的运行方式设置了约束,从而影响所形成的逻辑和物理应用及服务组合,(v)质量属性,如功能性和非功能性服务质量与用户体验质量,包括可用性和灵活性、可靠性、效率、可维护性、安全性和隐私性,若忽略这些属性将损害系统性能。

这些通用构建元素已被映射到多接入边缘计算参考架构中,以定义用于描述在 MEC系统中与MEC应用或服务的创建、实例化、供应、迁移和终止相关的主要实体的高层级领域模型(请注意,由于欧洲电信标准协会规范未从开发和部署视角区分应用与第三方服务,因此二者均通过微服务作为其功能的基本构建模块进行建模)。

根据上述机会性物联网服务建模类别(即物联网实体、物联网环境和物联网服务)所形成的MEC系统的领域模型如图4所示。聚焦于MEC服务视角,我们得出以下观察结果:

物联网实体 。 我们将MEC应用、其他MEC系统或第三方服务以及用户设备视为提供或消费相关服务的物联网实体。用户设备既产生服务所消费的数据(例如传感器数据),同时服务也可能访问或控制用户设备中的应用组件。反过来,服务内容被应用或其他服务所消费,以提供编排反馈为例。

物联网服务 。所提供的服务,其中机会性元素首先在服务配置文件中报告,即其高层级描述,然后在服务模型中报告,包括其输入、输出和集体功能。我们将在下一章节中详细讨论这些方面。由于多接入边缘计算规范没有区分应用和第三方服务,因此从开发和部署视角来看,它们的功能均通过微服务作为基本构建模块进行建模。

物联网环境 。 首先,物联网环境包含物理和虚拟的多接入边缘计算系统环境,包括多接入边缘计算平台和主机,其中实体和多接入边缘计算系统元素共存。这包括多接入边缘计算平台和主机,在这些平台上系统编排器将系统策略和环境约束施加于服务执行过程中。同时,在平台层级也会考虑服务运行的物理环境,包括本地网络。

上下文 。描述模型中物联网实体、环境和服务之间的依赖关系。MEC服务根据请求实例化,可以独立运行,也可以作为MEC应用的一部分运行,其依赖关系在服务配置中描述。这包括来自用户设备的数据以及从其他服务获取的所使用内容,这些服务可能是系统服务或第三方服务,也可能是外部服务,例如天气服务。此外,多接入边缘计算系统服务会利用该服务提供的信息或其在系统运行过程中生成的信息,用于编排与管理。然而,还存在额外的依赖关系通过利用即将出现的应用和服务上下文中尚不明确的服务来创建。在此情况下,微服务范式非常有用,因为它有助于简单地重用现有的服务组件。这些动态依赖关系包括服务配置和聚合、其使用策略以及计费信息,均由编排器解决。

示意图2

示意图3

3.2. 机会性多接入边缘计算服务元模型

基于机会性物联网服务建模[6, 14]流程,下一步是依据MEC规范,为机会性边缘服务提供一个元模型。该元模型捕捉了两种方法(机会性物联网服务模型和 MEC规范)的元素,用于概念和功能映射。所得映射如表1所示。为清晰起见,参数集并非详尽无遗,且已省略标识符,以重点关注服务实例化、供应、互操作性和生命周期管理方面。

服务名称 。服务的标识符,可在应用上下文或服务信息中获取,包括网络地址参数。

服务描述 。基于标准化本体的、人和机器可读的服务描述,作为MEC系统描述符的一部分发布,并根据用户请求(应用上下文)和服务供应配置进行提供。还包括描述性的提供商信息、计费和使用策略。

服务类别 。边缘平台服务分为(i)系统服务、(ii)第三方服务,以及(iii)托管在远程系统中的外部服务。系统服务提供核心平台架构所需的功能,例如应用程序包管理和无线网络信息(RNIS)。第三方服务是按需实例化的、与位置、上下文和应用相关的特定服务。外部服务部署在系统控制之外,在服务逻辑实现中需要用到,例如天气数据,会带来额外复杂性。服务类别是服务本体的一个条目在多接入边缘计算(MEC)的服务信息(ServiceInfo)中提供的技术/分类,服务范围(Scope)将服务定义为专用服务(针对特定用户设备(UE))或共享服务。

服务参数 。服务的功能性和非功能性服务质量与用户体验质量参数,例如允许的最大访问延迟和可靠性,以及相关的关键绩效指标。包括从MEC规范中衍生出的通用核心执行能力,如数据流量规则和运营商策略。

服务输入 。通过系统、第三方服务API和外部数据源(包括远程系统和用户设备)进行服务执行所需的信息。MEC标准为服务配置提供了依赖关系,将这些依赖关系与输入关联,作为集合或聚合的一部分。

服务输出 。通过其应用程序接口发布的服务所产生的内容和输出。在多接入边缘计算系统中,包括应用上下文、导出接口以及向其他系统组件发送的通知。此外,在系统管理中,服务迁移和性能监控等场景需要服务信息和服务移动性参数。

服务与上下文前置条件 。服务实例化、执行和迁移所需的功能条件,例如应用包和服务依赖关系。MEC编排器将应用执行分配给能够在其主机上满足服务参数的MEC平台。在MEC规范中,这些参数包括配置中描述的逻辑服务集合与聚合,以及所需特性、硬件要求、存储资源、传输协议和数据流量规则。

服务与上下文影响 。由服务执行所产生的事件,这些事件作为MEC通知发布。可以基于这些影响构建整体或聚合的服务逻辑,推动微服务之间的执行状态转换。主机根据这些影响向平台和系统编排器提供服务执行的反馈。

服务提供约束 。源自相关系统组件的约束。根据MEC规范,包括连续性、共址以及移动性方面。这些约束在服务配置中进行描述,由编排器验证后,再通过平台管理器施加给主机和虚拟化基础设施。为了遵循机会式服务建模流程,我们创建了一个操作性服务模型,以展示多接入边缘计算系统的要素,如前一章节所述,还可用于识别其机会主义 cele‐这些参数很难通过静态元模型进行处理,如[14],所示,因此需要一个附加和互补模型。基于领域模型和服务配置文件的生成的元模型如图5所示,它定义了建模的服务的上下文。从物联网实体出发,我们识别出服务内容消费者,即系统服务、应用程序和用户设备,其中只有系统服务是静态的。如前所述,服务迁移可能基于用户设备移动或系统编排而启动。类似地,物联网环境由MEC系统组件组成,其中主机在实例化期间可视为静态,因为其需求已得到保证。然而,机会式物理环境由系统服务RNIS和MEC位置表示。作为物联网服务组件的微服务在服务请求时作为配置的一部分被实例化,但其位置会根据编排器决策而变化,并且响应系统编排是动态的。

此外,该元模型描述了这些机会性元素之间的交互,例如“发起”、“利用”、“使用”、“管理”和“监控”,这些交互依赖于作为提供约束、输入和输出、上下文前提条件以及效果的服务配置。基于此类服务配置文件和元模型,可以识别多接入边缘计算系统及建模的服务中固有的机会性元素,并在软件开发过程的后续步骤中进一步处理。

示意图4

4. 用例:移动性分析服务

在本章节中,我们将所提出的开发过程实例化为一种简单而有效的移动性分析服务(MECMMS),该服务最初在我们先前的研究[40, 41, 42]中提出。事实上,移动边缘计算系统中的一个关键组件是移动性管理系统的服务,其负责收集用户在连接到系统时的移动数据[3]。其目标是优化应用重定位,例如通过检测用户的移动轨迹和模式,并对这些事件进行预测。特别是在边缘计算背景下,当用户在与不同边缘主机相关联的接入点之间移动并触发切换时,情况尤为复杂,因为此类切换需要通过核心网络进行应用重定位、实例化等操作,这些均由系统编排器管理。通常情况下,大规模的此类系统服务需要对系统状态具备全局视图以及云规模计算能力,而实现实时响应能力具有挑战性。已有研究[9, 43, 44]提出了面向在线环境、针对边缘场景、依赖机器学习方法并结合上下文信息的认知方法,以应对移动性管理问题。

我们通过遵循所提出的开发过程,来应对此类MECMMS的复杂性和机会主义特性。首先,使用MEC服务元模型和服务配置文件对服务进行建模,从而生成服务模型。然后,描述了一个服务实现示例,旨在优化多接入边缘计算系统的运行。最后,对多接入边缘计算中的一个QoS属性进行了分析使用真实世界数据集进行分析,阐明了该服务如何应对MEC系统的机会性特性。

4.1. 多接入边缘计算移动性分析服务

本文提出的MECMMS服务模型基于MEC服务元模型。特别是,我们重点关注MEC主机层级,而省略了系统级编排与管理组件的建模,因为需要考虑大量组件及其交互,而这并不会增加本文的贡献。

MECMMS 被视为多接入边缘计算系统中的一项系统服务,属于 MEC 移动性管理服务集的一部分。当应用移动性服务接收到重定位请求 时,会与 MECMMS 协同分析并规划跨平台的迁移。在实例化时,每个 MEC 平台(物联网环境)上都会启动一个实例。MECMMS 被设计为一组微服务,依赖于其他系统服务和外部服务的输出,以实现服务功能。MECMMS 的前置条件和约束是:每个平台上均部署有一个实例,并且微服务集合被部署在同一平台中,以实现靠近用户的实时内容分发。如 [41], 所述,可根据主机的容量,在系统中将一组 MECMMS 实例部署为层级结构,附加的前提条件包括 微服务容器大小和足够的处理能力。该服务的参数即质量度量,是与内容分发相关的延迟,这对于应用重定位的系统级编排至关重要。

在保持用户体验质量(QoE)连续性的同时响应用户移动性。MECMMS的输入为用户设备位置信息和地理地图。在MECMMS的上下文中,机会性属性指的是在运行时在系统中移动的用户(物联网实体),这些用户由两个标准化的MEC服务(定位服务和RNIS API)表示。MECMMS的输出是一个数据集,其中包含用户移动性分析结果和一张标注地图,本章节后续将对此进行描述。该数据集提供了关于用户在整个系统中移动性的信息,用于应用迁移的编排与管理。

示意图5

图6展示了生成的MECMMS服务模型。MECMMS的操作基于四个微服务(物联网服务),即Web用户界面(UI)、轨迹生成器(TG)、优化功能和可视化。该服务使用了两个标准化的MEC系统服务,即位置API和RNIS API,以及一个外部地图服务。MECMMS的前端是UI,它为移动数据分析提供感兴趣区域(ROI)的参数,即地理区域和时间段。该ROI被发送到TG微服务,TG通过MEC位置API获取用户设备的位置数据,即在指定时间段内与ROI内接入点的连接情况。TG计算用户设备在多接入边缘计算系统中的移动轨迹,即用户设备通过连接到接入点的位置信息。随后,这些轨迹连同来自RNIS的用户设备切换数据,在优化服务中进一步分析,从而发布接入点信息数据,其中包含从数据生成的一系列数学特征。最后,可视化模块根据Web UI的初始请求创建一组接入点的标注地图。

关于服务配置文件,MEC规范在[45]中涉及了移动性管理服务以及相关的应用重定位。用户移动导致的切换,或按需系统编排请求(例如用于性能优化、负载均衡和策略执行),会发起一个应用迁移请求。作为前提条件,需要确定迁移的最佳时间窗口和目标主机。在此基础上,为了应对用户体验质量(QoE)问题,可以将一组附近的主机指定为重定位组,前提是该应用可在其中任意一个主机上运行。另一种解决方案是,在MEC平台管理器功能[45]中引入一个优化功能。

4.2. 边缘机会性特性的分析

在本小节中,我们首先介绍MECMMS服务的输出数据集。然后,利用真实世界数据集进行数据分析,以识别出描述数据集中用户移动的机会性特性的特征集,旨在优化MEC应用重定位。在分析过程中,我们遵循第2.4章节中介绍的特征工程原则,以识别并利用影响MECMMS服务提供的那些机会性特征。

4.2.1. 问题的设定

作为问题定义的起点,一位领域专家已确定应用重定位是MEC系统的 机会性 的 特性,在数据分析中可通过特征工程解决。根据MEC规范[45], ,连续性是多接入边缘计算系统的一项性能指标,用于描述在用户设备会话转换期间(例如切换)应用持续运行的需求。特别是,在MEC主机之间的应用重定位会导致中断。连续性分为不同类别:无连续性、低连续性、软连续性和高连续性。每个类别对可容忍的中断时间有不同的限制。

如图6所示,MECMMS服务为每个 AP提供一个数据集,描述了上述特征集和数据分析结果。然而,由于多接入边缘计算系统及MECMSS服务尚未有真实世界的实现,为了替代数据源(即多接入边缘计算系统API),我们使用了[46]中的一个现有真实世界数据集。该数据集包含以秒级精度收集的用户设备连接数据,采集时间为2007年至2015年,数据来自在芬兰奥卢市部署的一个开放式WiFi网络中的1300个WiFi接入点。整个数据集的规模约为2.75亿个数据点。但出于演示目的,我们使用了其中的一个子集,该子集包含2015年2月期间在410个WiFi接入点收集的大约五十万个数据点。

作为数据分析的结果,一组接入点被确定为在整个部署中关于连续性不同属性最具机会性的接入点。

4.2.2. 数据预处理

基于我们之前的工作[40, 8],,数据集已经完成预处理:(i)移除持续时间少于5秒的无线网络接入点之间的切换(最后一次切换作为异常值被移除),以减轻用户快速移动造成的影响;(ii)检测一组具有非常强发射器的接入点,这些接入点在某些时刻几乎连接了区域内所有用户设备,即使距离较远(这些切换已被作为异常值从数据集中移除);(iii)移除每日连接数少于100次的接入点,旨在聚焦高负载接入点并为后续分析提供足够的样本。经过该数据预处理过程,初始的410个接入点减少至56个接入点,总共包含502600个数据点。

旨在研究连续性,我们初步准备了数据,这些数据最初仅提供切换事件的以下属性:时间戳、设备ID、源接入点、目标接入点和接入点间距离。由于我们关注的是不考虑单个用户设备移动模式的切换,因此丢弃设备ID。数据集中的变量定义为数值变量(距离)、分类变量(源接入点和目标接入点)以及日期和时间(时间戳)。

由于时间戳仅记录用户连接到特定接入点的时间,因此无法直接估算会话时长和用户移动情况。通常情况下,无线网络连接是间歇性的,数据中并未提供用户从源接入点实际断开连接的时间。同样,数据也无法显示用户在接入点之间移动的速度,即无法判断用户是通过车辆快速移动 还是通过步行缓慢移动。因此,我们利用接入点之间的地理空间距离(即可在单独文件中获取的GPS坐标)作为依据最大允许重定位延迟的近似值。在文献中,通常使用不同的距离度量(如地理空间坐标或跳数)来估计通信延迟。然而,在我们的数据集中,底层网络拓扑不可用。此外,通常认为距离较远的连接会遭受较低的用户体验质量,并与距离成正比。

经过上述数据预处理步骤后,我们决定将地理空间距离作为表示用户移动性不同方面的属性,用于研究连续性。假设用户在接入点之间的移动模式可以被预测,我们可以认为预期切换的距离与多接入边缘计算系统选择重定位组并完成应用重定位过程所拥有的时间成正比,同时维持用户体验质量。此外,当可以在部署中构建接入点的距离矩阵时,多种数学方法可用于在机器学习应用中进一步分析数据。

最后,在此步骤中,由于我们关注切换的机会性特征,因此将数据按每个接入点(AP)划分为一个表格,其中包含所有以该接入点作为目标接入点的切换事件。这种数据变换方式便于为每个接入点计算切换的常用统计度量。

4.2.3. 机会性特征集的设计

接下来,我们设计用于连续性数学建模的特征集。自从我们的数据集是数值型的,我们可以直接构建表示不同度量和属性的特征向量每个接入点的距离数据。我们将这些向量称为机会性特征边缘向量(OFVE),以强调这些向量描述了显著的和机会性的—动态的、多样的、零星的和分散的—边缘计算的特征。在描述了这样的初始特征向量之后,可以选择与当前问题相关的特征集。

关于所考虑的用例,基于常见统计,最初考虑以下特征集以表示切换距离的机会性特性:

  • MAX 到接入点的切换最长距离;距离越长,能够连接到该接入点的用户越多,用户体验质量越差,从而导致机会性的连接。
  • 平均值 到接入点的切换距离的算术平均值,反映向更长切换距离的趋势。
  • 众数 在接入点中最常出现的距离,反映向更长切换距离的倾向。
  • RANGE 到接入点的切换距离范围,反映切换距离的差异。
  • SD 到接入点的切换距离的标准差;较大的 SD 意味着距离变化较大,导致机会性连接。
  • SKEW 接入点切换距离分布中不对称性(极端值)的度量;显著偏度的分布反映异常的切换距离。

尽管上述特征是标准的统计度量,此外,领域专家还可以提出一组“手工设计”的特征,这些特征在计算上可能更复杂,但被认为更具表达力。在该用例中,我们考虑了以下附加特征:

  • CV 接入点之间比较的变异系数,由于在数据集中观察到平均值和标准差之间的变异性较大,因此该系数很有用。
  • UNIQ 观察到切换至某个接入点的唯一源接入点数量;连接到该接入点的用户设备越多,其工作负载就越多样化和动态化。
  • ENT 接入点中切换距离的熵作为不确定性和多样性的度量。
4.2.4. 特征选择

为了降低OFVE特征空间的维度(可能非常宽泛,包含基于MEC标准和领域知识的大量特征,例如),可采用多种特征选择技术,相关综述参见,例如[39]。为了简化,我们利用皮尔逊相关性来减少上一节第4.2.3节中所述特征提取所产生的特征空间。我们将OFVEs的相关系数设为0.5,并移除具有较高相关性的特征,同时保留具有负相关性的特征,以增加数学建模的多样性。

因此,初始包含九个特征的距离OFVE的维度被降低为一组四个特征,即 MAX、MEAN、SKEW和UNIQUE,如表2所示。手工设计的特征UNIQUE因此被自动确定为比某些其他标准统计度量更能表达距离变化,表明了在建模过程中领域知识的重要性。

Max Mean Skew Unique
Max 1.00
Mean 0.33 1.00
Skew 0.09 -0.52 1.00
0.40 0.45 -0.34 1.00

表2:选定特征的相关矩阵。

4.2.5. 分析

为了便于领域专家进行可视化分析和解读,表3中确定的接入点以及在表4中更详细列出的接入点已在图7的地图上标出。从图中可以明显看出,机会型接入点分布在从北、西和南通往奥卢市中心的主要路线上。例如,位于高速公路交叉口附近的接入点930具有较高的切换平均距离。位于市中心南北两端的接入点823、848和920具有唯一源接入点。有趣的是,靠近长途汽车站的接入点834具有显著高的平均切换距离且偏度较低,这可能与到达乘客的连接模式有关。有三个例外情况不符合初始假设:两个位于城市商业中心正中心的接入点(762、767),以及一个位于体育场馆附近的接入点(581)。接入点762的切换距离最大值较低,这可归因于其极为中心的位置。接入点581的切换距离最大值和平距离均值均为最低,唯一源接入点数量最少,但偏度最高,这可能表明用户仅从特定方向缓慢地到达体育场馆,例如步行。

关于所呈现网络拓扑中的连续性,属于无连续性和低连续性类别的应用(可容忍数分钟的中断),除了在人口密集区域(如体育场馆(AP 581))发生偶发事件时需供应足够资源外,未观察到明显的缺点。对于部署软连续性(可容忍短时间中断)和高连续性(具有严格延迟限制)的应用,较低的切换中断风险是必要的。

由于移动速度加快导致距离增加,使得在主机之间编排和部署应用组件的时间窗口变得非常小,如接入点581和中心接入点762的情况,这带来了挑战。因此,在这些接入点的邻近区域定义重定位组是一项重要的架构部署决策。当唯一源接入点数量较高时(例如接入点823、848和920),并且可能距离较短,或者通过精心设计服务器部署[8],,可以避免昂贵的主机间切换。当均值(和标准差)较高且偏度较大时(接入点581、834 和930),编排将变得困难,明显需要系统服务来实现自动规划、调度和负载均衡。

ID Max 平均 偏度 唯一值
197 108.02 4.04 7.09 72
581 65.53 0.67 26.73 36
762 73.26 3.74 9.43 144
767 99.89 4.74 8.28 127
823 111.75 6.58 4.90 175
834 88.13 12.40 0.89 153
848 92.63 6.83 4.91 202
920 90.84 6.97 3.44 185
930 102.56 11.88 2.93 156
931 102.56 9.61 3.32 124
936 104.88 6.77 4.02 157

表4:顶级机会主义接入点。

示意图6

5. 结论

来自不同来源的多种异质因素在边缘计算系统中引入了机会性行为(如大规模部署、用户移动性、短暂交互等)。尽管对运行环境动态性的了解通常基于领域知识,但更加系统化的方法实际上有助于在整个边缘应用和/或服务生命周期中应对这些问题。如果从服务建模初期就开始应用这些方法,包括初始分析和设计步骤,以识别并后续处理机会性元素及其特性,则效果尤为显著。服务建模是物联网上下文中已有研究的活动,但往往忽视了边缘计算系统的独特需求、属性和特征。

本文提出了一种新颖的服务建模方法,应用于ETSI MEC参考架构,特别针对边缘计算中的机会性特性。此外,我们基于领域专业知识,通过特征工程方法对机会性特性的识别与管理进行了形式化,以捕获并选择有意义的方面集合,用于后续分析和机器学习建模。为说明本文提出的方案,我们对MEC环境下的基于微服务的用户移动性分析服务进行了建模,并为真实世界数据集中的用户移动性活动构建了机会主义向量特征,用于数学分析。此类精细化信息有助于在大规模、移动、边缘计算场景中获取关于用户行为的洞察,从而实现“在正确的时间到达正确的位置”这一边缘承诺。最后,如基于所提方法的建模与分析结果所示,我们识别出一组边缘基础设施组件,网络运营商可在其中观察并处理机会性特性。

我们的未来工作将集中在边缘建模方法的进一步开发,以及在真实世界用例中研究特征工程方法,基于一个5G测试平台[47]作为边缘计算基础设施的一部分。

该数据集通过合成方式模拟了多种发动机在运行过程中的传感器监测数据,旨在构建一个用于机械系统故障检测的基准资源,特别适用于汽车领域的诊断分析。数据按固定时间间隔采集,涵盖了发动机性能指标、异常状态以及工作模式等多维度信息。 时间戳:数据类型为日期时间,记录了每个数据点的采集时刻。序列起始于2024年12月24日10:00,并以5分钟为间隔持续生成,体现了对发动机运行状态的连续监测。 温度(摄氏度):以浮点数形式记录发动机的温度读数。其数值范围通常处于60至120摄氏度之间,反映了发动机在常规工况下的典型温度区间。 转速(转/分钟):以浮点数表示发动机曲轴的旋转速度。该参数在1000至4000转/分钟的范围内随机生成,符合多数发动机在正常运转时的转速特征。 燃油效率(公里/升):浮点型变量,用于衡量发动机的燃料利用效能,即每升燃料所能支持的行驶里程。其取值范围设定在15至30公里/升之间。 振动_X、振动_Y、振动_Z:这三个浮点数列分别记录了发动机在三维空间坐标系中各轴向的振动强度。测量值标准化至0到1的标度,较高的数值通常暗示存在异常振动,可能与潜在的机械故障相关。 扭矩(牛·米):以浮点数表征发动机输出的旋转力矩,数值区间为50至200牛·米,体现了发动机的负载能力。 功率输出(千瓦):浮点型变量,描述发动机单位时间内做功的速率,取值范围为20至100千瓦。 故障状态:整型分类变量,用于标识发动机的异常程度,共分为四个等级:0代表正常状态,1表示轻微故障,2对应中等故障,3指示严重故障。该列作为分类任务的目标变量,支持基于传感器数据预测故障等级。 运行模式:字符串类型变量,描述发动机当前的工作状态,主要包括:怠速(发动机运转但无负载)、巡航(发动机在常规负载下平稳运行)、重载(发动机承受高负荷或高压工况)。 数据集整体包含1000条记录,每条记录对应特定时刻的发动机性能快照。其中故障状态涵盖从正常到严重故障的四级分类,有助于训练模型实现故障预测与诊断。所有数据均为合成生成,旨在模拟真实的发动机性能变化与典型故障场景,所包含的温度、转速、燃油效率、振动、扭矩及功率输出等关键传感指标,均为影响发动机故障判定的重要因素。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值