面向服务的边缘计算资源分配循环博弈
摘要
现有研究采用面向边缘的资源分配(EORA)方案,其中边缘节点缓存服务并调度用户请求,以在云和边缘节点之间分发工作负载,从而实现高质量服务和低延迟。然而,EORA并未充分考虑到服务提供商有时独立于边缘运营商,并拥有自身的目标。为应对服务提供商与边缘节点之间的冲突与协作问题,我们设计了一种面向服务的资源分配(SORA)方案,其中边缘节点和服务提供商调整其资源分配以提供所需服务。我们首先证明此类资源分配问题是NP难的。随后,我们提出一种三方循环博弈(3CG),涉及用户、边缘节点和服务提供商,三者分别通过选择高质量服务、高价值用户和成本效益高的边缘节点进行服务部署来做出各自的决策。基于3CG,我们证明了纯策略纳什均衡(NEs)的存在性及其近似比,并设计了用于资源分配的集中式与分布式近似算法。最后,大量实验结果验证了所提算法的有效性与收敛性。
索引术语 —边缘计算,资源分配,博弈论
1 引言
近年来,我们见证了边缘计算正成为一种新范式,使得计算能够在网络边缘进行[1],[2]。它减少了用户与云之间的数据交换量,并降低了服务访问延迟,这是分布式系统中服务提供面临的关键问题,尤其是在物联网中。然而,边缘节点在计算和通信资源方面表现出异构性和不足性,因此如何有效分配边缘资源以服务用户成为一个重要的问题。
大多数现有研究在处理该问题时采用了图1a所示的面向边缘的资源分配(EORA)方案。在EORA方案中,边缘节点是资源分配的主体。一些研究[3]–[12]主要关注用户请求的调度。在给定用户的 服务请求 后,允许边缘节点选择是处理这些 用户请求 ,还是将工作负载迁移到远程 云 ,以实现各种目标,例如高质量的服务以及低能耗或低延迟成本。一些近期的研究[13],[14]进一步将 分配 过程分解为 请求调度 和服务部署。在服务部署阶段,决定将多个服务部署在边缘节点上。
然而,现有的EORA方案可能由于以下两个原因而无法达到最佳性能。首先,边缘运营商和服务提供商之间可能存在利益冲突,因为大多数服务提供商并不运营其服务所部署的边缘设施。服务提供商通过云来管理服务所需的资源(例如内容数据、服务运行程序等),并将其部署在边缘节点上,而边缘运营商则控制着边缘节点的资源。从服务的角度来看,我们需要对边缘节点、用户和服务提供商的利润进行建模,并设计出能够平衡总利润和公平性的最优资源分配方案。服务通常需要来自边缘节点或云的多种资源,包括计算、通信以及相关数据。其次,许多新兴服务不仅需要来自边缘节点上计算和通信资源的用户数据,还需要服务提供商的支持。
例如,为了提供人工智能服务(如增强/虚拟现实[15],[16], 视频分析、语音识别),边缘节点需为来自用户的数据分配资源,并利用服务提供商提供的机器学习模型进行处理。欧洲电信标准协会已指出,此类增强/虚拟现实和视频分析是移动边缘计算的主要应用场景[17]。此外,一些复杂的神经网络需要被拆分并同时部署在边缘节点和服务提供商端[18]。
近期的EORA方案[13],[14]将分配过程分离为请求调度和服务部署,忽略了服务提供商的作用,因此无法准确建模边缘计算中的复杂场景。我们需要一个更通用的模型,同时考虑边缘资源分配和服务提供商资源分配。
为了克服EORA的不足,我们提出了面向服务的资源分配(SORA)方案,在其中分配决策是服务提供商与边缘运营商之间协商的结果。
如图1b所示,一个服务请求通过用户、边缘节点和服务提供商的合作来完成。边缘节点和服务提供商的利润被独立考虑。此外,我们进一步设计了SORA中的利润和成本,以优化计算和带宽资源的分配,这两种资源是边缘计算中最常见的受限资源。然而,寻找SORA的全局最优解面临两个困难:最优SORA问题的NP难问题,以及用户、边缘节点和服务提供商之间缺乏协作和存在冲突。基于博弈的方案已被证明有助于设计用于边缘计算中资源分配的分布式和竞争性机制[10]–[12],从而能够解决这两个难题。因此,在本文中,我们将SORA建模为一个博弈。构建博弈模型有两个主要挑战:(1)如何建模边缘节点和服务提供商具有个体利益且需要合作完成用户请求的事实;(2)如何保证所提出模型的效率和性能。
为应对上述两个挑战,我们引入了一种三方循环博弈(3CG),以描述三方之间的相互选择关系,即用户选择(请求)服务提供商,服务提供商选择(部署)边缘节点,边缘节点选择(服务)用户。3CG算法在每个时隙开始时运行。在每次运行中,用户会请求多个服务提供商提供的服务,这相当于用户选择了所需的服务提供商。随后,边缘节点选择能够为其提供最优质服务的用户。接着,服务提供商将服务部署在能带来最高利润的边缘节点上。3CG重复这一循环选择过程,直至收敛,该收敛性可通过理论和实验加以证明。
与以往边缘计算中的博弈不同,我们通过刻画跨方参与者之间的合作以及同方参与者内部的竞争,定义了三方参与者的合作收益函数。我们分析了势博弈的性质,并基于这些性质证明了3CG存在纳什均衡(NEs)。此外,利用效用系统[19],[20], ,我们证明了3CG的纳什均衡对最优解具有1/3的近似比。而且,该纳什均衡及近似比不依赖于任何具体的收益函数形式。随后,我们提出了一种分布式资源分配算法,可实现该博弈的纳什均衡。
总之,我们做出了以下贡献:据我们所知,我们是首个将SORA建模为优化问题并证明其NP难问题的研究。SORA考虑了边缘节点和服务提供商之间需要进行协作的情况。彼此协作以为用户提供多种新兴服务,而它们可能具有不同的个体意图。我们设计了一种新的博弈模型3CG,用于建模SOA中三方参与者之间的合作与冲突。该模型独立于各种实际场景中具体的收益形式。我们推导出纳什均衡的存在性,并具有相对于最优解的恒定近似比。我们实现了针对3CG的集中式和分布式算法,以获得SOAR的近似解。数值结果表明,我们的算法实现了理论上的有效性,具有稳定的长期公平性能,并且优于基线算法。
本文的其余部分组织如下。我们首先在第2节中提出系统模型和问题建模。然后,在第3节中详细设计了3CG模型。我们在第4节和第5节中分别通过理论分析和数值研究来评估3CG的性能。此外,在第6节中总结了相关工作。最后,我们在第7节中得出结论。
2 问题建模
在本节中,我们首先对网络环境进行建模,描述服务过程,并将资源分配的效用定义为分配收益与成本之间的权衡。然后,我们将SORA表述为一个最大化总体效用的优化问题。最后,我们证明该优化问题为NP难。
2.1 边缘计算中的服务提供
在我们的模型中,考虑了一个具有三方参与者的地理分布的边缘系统:服务提供者集合 $S = {1, 2, …}$、用户集合 $U = {1, 2, …}$以及边缘节点集合$E = {1, 2, …}$。此外,模型中使用的关键符号及其定义已在表1中总结。为了完成用户请求的服务,所有参与者需要协同工作,即来自 $u$的请求需要在一个由 $(u, s,e)$构成的三元组中完成。我们假设时间被划分为时隙。在每个时隙中,资源分配方案将根据当前请求和网络状况进行更新。
为了表征系统的网络状况,我们使用状态向量$n_{u,e}$和$n_{e,s}$来表示当前时隙中两个参与者之间的网络状况。$n_{u,e}$或$n_{e,s}$的元素是诸如带宽、延迟、抖动等网络测量值。为了描述参与者的性能,我们考虑服务的 K种资源,包括带宽资源、计算资源等。边缘 $e$或服务提供商 $s$的总资源分别表示为资源向量 $r_e \in \mathbb{R}^K$或 $r_s \in \mathbb{R}^K$,其中第 $i$个元素是第 $i$种资源的能力。
来自用户$u$的服务请求包含对边缘节点和服务提供商的资源请求,表示为一对资源请求向量$b_u$和$c_u$,其中$b_u, c_u \in \mathbb{R}^K$。给定来自用户$u$的一个服务请求,需要从一组候选者中确定一个服务提供商$s$,该候选组用二进制向量$d_u$表示,其中第$s$个元素$d_{u,s} = 1$,若将服务提供商$s$分配给用户$u$。类似地,我们使用$d_{s,e}$和$d_{e,u}$来表示所请求的服务是否将被部署到边缘节点$e$上,最终
| 符号 | 定义 |
|---|---|
| $U$ | 用户集合 |
| $S$ | 服务提供者集合 |
| $E$ | 边集合 |
| $n_{x,y}$ | $x$和 $y$之间的网络状况, $x, y \in U \cup S \cup E$ |
| $a_x$, $a_{x,y}$ | 资源分配的 $x$,其中$a_{x,y}$表示表示为服务提供商$s$分配给 $y$的资源 $x$, $x, y \in U \cup S \cup E$ |
| $b_u$, $c_u$ | 用户 $u$对边缘节点的所需资源 以及服务提供商$s$ respectively |
| $d_x$, $d_{x,y}$ | 决策 $x$,其中$d_{x,y}$表示是否 $x$选择$y$, $x, y \in U \cup S \cup E$ |
| $Q(u, s, e)$ | $u$、 $s$和$e$合作的利润 |
| $C(u, s, e)$ | $u$、 $s$和 $e$的合作成本 |
| $p(x)$ | $x \in U \cup S \cup E$的策略 |
| $P$ | 玩家的策略组合 |
| $P’$ | $p(x)$ ${s}$更改策略后的策略组合 |
| $\varphi_x(P)$ | 策略组合 $P$中服务提供商$s$ $x$的收益 |
到$p(p(x))$ $\varphi_x(P)$ 策略组合 $P$中服务提供商$s$ $x$的收益
边缘 $e$将分别为 $u$提供服务。综上所述,为了完成用户请求,用户 $u$、服务提供商$s$ $s$和边缘 $e$需要共同协作,即$d_{s,e} d_{e,u} d_{u,s} = 1$。此类三元组称为有效的。然后,边缘 $e$需要为用户分配资源,该分配由分配矩阵 $a_e \in \mathbb{R}^{|U|\times K}$表示,其中第 $u$行 $a_{e,u}$是为用户$u$ $u$分配的资源。类似地,服务提供商$s$ $s$为用户分配资源,并具有分配矩阵 $a_s \in \mathbb{R}^{|U|\times K}$,其中第 $u$行$a_{s,u}$是为用户$u$ $u$分配的资源。所有 $d_u$、 $d_s$、 $d_e$、 $a_e$和$a_s$构成边缘系统的资源分配。
2.2 资源分配的效用
类似于以往在边缘或云计算领域的研究[10],,我们假设用户请求在一个时隙内保持不变,在该时隙中,我们的系统为当前的用户请求执行资源分配。由于完成一个服务请求需要用户 $u$、边缘 $e$和服务提供商 $s$之间的协作,因此我们衡量每个 $(u, s,e)$元组的效用,考虑用户 $u$的体验质量(QoE)以及边缘 $e$和服务提供商 $s$的分配资源成本(CoR)。
在我们的模型中,三元组 $(u, s,e)$中用户$u$的用户体验质量QoE从两个方面进行衡量:服务性能和服务提供商$s$的网络质量。从服务性能的角度,我们考虑用户请求资源的满足程度。这取决于边缘节点 $e$和服务提供商 $s$的资源分配。边缘节点 $e$分配资源$a_{e,u}$以满足来自用户$u$的请求 $b_u$。因此,我们将用户请求的填充率作为QoE的一个因素,即$Q_e(a_{e,u}/ b_u)$ , ,其中 $\cdot/\cdot$为两个向量的逐元素除法, $Q_e(\cdot)$为多个因素的QoE函数。现有研究表明,QoE函数具有多种形式,例如关于因素的线性[12],、指数[21],、对数[22]函数。其具体形式不影响我们模型的分析,因此将在数值模拟中给出。
类似地,来自服务提供商$s$的QoE为$Q_s(a_{s,u}/ b_u)$。接着,考虑到三元组 $(u, s,e)$中的两个链路,我们定义了来自服务性能作为
$$
Q_{service}(u, s, e) = d_{s,e} d_{e,u} d_{u,s} Q_e\left(\frac{a_{e,u}}{b_u}\right) Q_s\left(\frac{a_{s,u}}{c_u}\right), \tag{1}
$$
其中三个部分的乘积意味着如果其中任何一个不合作,则用户体验质量将从为网络。状况的角度来看,参与者 $x$和 $y$之间的网络质量会影响用户体验质量,因为服务请求由三方协作完成。它可以被定义为状态向量的函数,即 $Q_{xy}(n_{xy})$,其中 $Q_{xy}$具有与 $Q_s$和 $Q_e$相似的属性。然后,考虑到三元组 $(u, s,e)$中的两个链路,我们将来自网络质量的用户体验质量定义为
$$
Q_{net}(u, s, e) = Q_{ue}(n_{u,e}) Q_{es}(n_{e,s}). \tag{2}
$$
到目前为止,我们可以将 $(u, s,e)$的用户体验质量表示为上述两个方面的乘积:
$$
Q(u, s, e) = Q_{service}(u, s, e) Q_{net}(u, s, e) \tag{3}
$$
接下来,我们将CoR定义为来自边缘 $e$和服务提供商 $s$的成本总和:
$$
C(u, s, e) = C(a_{e,u}) + C(a_{s,u}), \tag{4}
$$
其中成本函数 $C$可以是任意增函数,例如,它对每个资源[14]呈线性关系。
需要注意的是,为了使模型更具通用性和可扩展性,我们使用资源向量(例如$n_{u,e}$、 $a_{x,y}$、$b_u$、 $c_u$)来表示一类资源。我们可以通过增加或减少向量的维度来调整资源因素。此外,我们的理论分析不依赖于 $Q$和 $C$的具体表达形式,它们将在实验中给出。
2.3 优化目标
在效用的定义下,我们将SORA表述为关于资源分配总体效用的优化问题:
$$
\max_{d_u,d_e,d_s,a_e,a_s} \sum_{u\in U} \sum_{s\in S} \sum_{e\in E} \left(Q(u, s, e) - C(u, s, e)\right) \tag{5}
$$
s.t.
$$
\forall u \in U,\forall e \in E,\forall s \in S: 0 \leq a_{e,u} \leq b_u, 0 \leq a_{s,u} \leq c_u, \tag{6}
$$
$$
\sum_{u\in U} a_{e,u} \leq r_e, \sum_{u\in U} a_{s,u} \leq r_s, \tag{7}
$$
$$
\sum_{e\in E} d_{e,u} \leq 1, \sum_{e\in E} d_{e,u} \leq 1, \sum_{s\in S} d_{u,s} \leq 1. \tag{8}
$$
在这些约束条件中,由于$a_{x,y}$是一个资源向量,小于号是按元素的。第一个约束条件(6)给出了资源分配的范围。第二个约束条件(7)限制了边缘节点或服务提供商分配的总资源。第三个约束条件(8)限制每个用户最多只能被分配给一个服务提供商,并且最多只能被一个边缘节点选择。
不幸的是,由于以下定理,寻找最优分配方案的问题是难以处理的。
定理1. 公式(5)中的优化问题是NP难的。
证明。 三维匹配(3DM)问题已被证明是NP完全的[23]。为了说明(5)的NP难性,我们证明三维匹配(3DM)问题可在多项式时间内归约到该问题。考虑一个实例
三维匹配: $X \subseteq {(u, s, e): u \in U, s \in S, e \in E }$,目标是最大化 $M \subseteq X$的基数,使得 $(u, s, e), (u_1, s_1, e_1) \in M, u\neq u_1, s\neq s_1, e\neq e_1$。使用相同的 $U, S$和 $E$,我们构造问题(5)的一个实例。由于 $Q(u, s,e)$和 $C(u, s,e)$可能不同,我们设定:
$$
Q(u, s, e) =
\begin{cases}
1 & (u, s, e) \in X, \
0 & (u, s, e) \notin X,
\end{cases}
$$
$$
C(u, s, e) = 0.
$$
注意,问题实例(5)的结果是三维匹配问题实例的最大匹配。由于三维匹配问题是NP难问题,因此可推知(5)也是NP难问题。
定理1表明了SORA的NP难问题。一方面,由于执行时间随输入规模呈指数级增长,在实际场景中获得(5)的精确最优解将耗费大量时间。另一方面,优化过程中忽略了服务提供商与边缘节点之间的竞争。因此,期望能够开发出考虑不同利益相关者的快速近似算法。
3 三方循环博弈
由于用户、边缘节点和服务提供商通常属于不同的个体,用于解决此优化问题的集中式算法可能并不合适。因此,为了应对这一NP难问题,我们将通过考虑不同个体利益,设计一种低复杂度的分布式机制。
3.1 玩家、策略和收益
由于分配方案是确定性的,我们考虑用户、边缘节点和服务提供商之间的一个纯策略博弈[19] 。三元组 $(u, s,e)$可以看作三个参与者相互选择。具体而言, $u$基于$d_u$选择 $s$, $s$基于 $d_s$选择 $e$,而 $e$基于 $d_e$选择 $u$。参与者 $x$的策略表示为 $p(x)$,即由 $x$选择的一组参与者。根据上述系统模型,$p(x) = {y: d_{x,y} = 1}$。如果 $x$未选择任何参与者,则 $x$的策略设为 $\emptyset$。本博弈的策略组合表示为所有参与者状态的笛卡尔积 $P = \prod_{x\in A} p(x)$。 $P_{-x}$定义为除 $x$外所有参与者的策略。我们将所有可能的状态记为集合$P$。由于 $p(x)$表示被 $x$选择的参与者,我们可以定义函数 $p^{-1}(x)$,将 $x$映射到选择$x$的参与者集合。若参与者 $x$将其策略从 $p(x)$变为 $p’(x)$,则策略组合$P$将转变为新的策略组合 $P’ = P \oplus p’(x)$。
收益被参与者用来决定如何选择策略。三元组中的参与者共享效用作为其收益,即服务提供商$s$ $e$和用户$u$ $s$从 $(u, s, e)$获得的利润分别为$Q(u, s, e) - C(u, s,e)$,而成本函数$C$ $u$的利润为 $Q(u, s,e)$ 。因此,参与者 $x$的总收益可定义为包含该参与者的各三元组利润之和:
$$
\varphi_e(P) = \max_{a_e} \sum_{u \in p(e)} \sum_{s \in p(u)} \left(Q(u, s, e) - C(u, s, e)\right), \tag{9}
$$
$$
\varphi_s(P) = \max_{a_s} \sum_{e \in p(s)} \sum_{u \in p(e)} \left(Q(u, s, e) - C(u, s, e)\right), \tag{10}
$$
$$
\varphi_u(P) = \sum_{s \in p(u)} \sum_{s \in p(e)} Q(u, s, e), \tag{11}
$$
其中所有参与者都从分配策略中获得利润(用户体验质量),而用户不共享成本总和。此外,边缘节点或服务提供商的收益是其资源分配效用的最大化。 $Q$和$C$的表达式会影响参与者策略,但不会影响机制运行和博弈特性。
3.2 决策机制
在博弈过程中,参与者会不断改变其策略,直到无法再提升自身的收益。为自私的收益最大化而任意更改策略,可能导致无限循环的博弈。
为了保证博弈的收敛,我们提出了一种称为抢占机制的决策机制。抢占机制的原则是,当参与者进行选择以及被选择时,都会采纳能够带来更高利润的策略。
参与者在拥有足够资源时,总会选择更多其他参与者或接受其他参与者的选中作为自己的合作者。然而,当他们的资源被完全占用时,他们需要决定是否以牺牲部分当前合作者为代价来与新的合作者建立关联。当参与者 $x$将其策略从$p(x)$变为 $p’(x)$时, $y \in p(x) \cup p’(x)$的收益会受到这一变化的影响。如果参与者 $x$更改了 $p(x)$中的一个元素,它将构建一个新的有效三元组(如上一节所定义),并会影响两个相关的先前有效三元组,如图2所示。如果玩家 $x$抢占玩家$y \in p’(x)$,则受此策略影响的参与者的收益会增加,即
$$
\varphi_x(P’) \geq \varphi_x(P), \varphi_y(P’) \geq \varphi_y(P), \tag{12}
$$
其中 $y \in p’(x)$和 $P’ = P \oplus p’(x)$。这些约束条件表明,参与者和被选中的参与者都能从策略变化中获益。根据抢占机制进行的策略变化可使博弈收敛到高总体收益状态,这在接下来的章节中将从理论和实践上加以证明。
$中选择一个元素,或从其合作者处抢占$p^{-1}(p’(x))$,由虚线连接的新三元组必须满足其利润高于由实线连接的任意一个先前三元组的利润。)
3.3 算法
在我们的模型中,每个分配周期包含三个阶段:(1)初始化阶段,用户在此阶段发布请求,参与者交换必要信息;(2)博弈阶段,参与者反复采取可行策略;(3)稳定阶段,博弈达到纳什均衡。接下来,我们将详细介绍这三个阶段。
算法1:3CG设计用于SORA问题
输入: b_u, c_u, n_{u,e}, n_{e,s}
输出: P, a_s, a_e
1 当任意参与者可以改变其策略时执行
2 对于 T ∈ {S, E, U} 执行
3 对于 x ∈ A 执行
4 如果 x ∈ T 则
5 p'(x), a_e, a_s ← 最大化 φ_x(P ⊕ p'(x))
6 P ← P ⊕ p'(x)
7 否则如果 y 选择 x 并且 φ_x(P) < φ_x(P ⊕ p'(y)) 那么
8 如果 x 没有足够的资源 那么
9 x 放弃利润最低的参与者
10 x 接受 y
11 P ← P ⊕ p'(y)
4 均衡分析
在本节中,我们从理论上分析了3CG的性能。我们证明了3CG具有纯策略纳什均衡,并且其最优解的近似比为1/3。
4.1 均衡的存在性
策略组合 $P^
\in P$是一个纯策略纳什均衡(NE)[24],如果任何一个参与者单方面偏离策略都无法获得利润,则该策略组合即为纳什均衡。
$$
\forall x \in A,\forall p’(x) \subset A: \varphi_x(P^
) \geq \varphi_x(P^* \oplus p’(x)),
$$
其中 $\varphi_x$是参与者 $x$的收益函数。纯策略纳什均衡表示没有任何参与者可以通过改变自身策略获得更高的利润。
为了证明纯策略纳什均衡的存在性,我们使用序数势博弈具有纯策略纳什均衡的推论。我们首先证明3CG是一个序数势博弈,然后可以直接得出结论。
势博弈的本质在于,参与者策略的改变会导致势函数严格增加。如果势函数是有限的,并且每次改变的增量具有正下界,则势函数不会持续增加。因此,该博弈将收敛,即该博弈存在纳什均衡。基于这一思想,我们对势函数的定义进行如下推广:
定义1(广义序贯势博弈)
。一个博弈是广义序贯势博弈,如果存在一个广义势函数 $\psi: P \to (K,\geq)$,使得$\forall P \in P$, $\forall p’(x) \neq p(x)$,
$$
\psi(P \oplus p’(x)) > \psi(P) \text{ iff } \varphi_x(P \oplus p’(x)) > \varphi_x(P),
$$
其中 $(K,\geq)$是一个全序集。
事实上,如果 $\psi$具有有限的范围,则 $\psi(P)$在 $K$中的序,记为 $o(\psi(P), K)$,是一个势函数。因此,根据广义序数势博弈的定义,可以直接得出以下引理。
引理1. 每个有限的广义序贯势博弈都存在纯策略均衡。
由于 $P$是一个有限集,我们构造一个广义序势函数来证明以下引理。
引理2。 3CG是一个有限的广义序数势博弈。
证明。 我们假设每个参与者仅选择一个参与者作为其策略。多参与者策略的情况可以通过考虑参与者多次选择同一参与者,从单参与者策略扩展而来。该证明的关键是找到一个广义势函数,该函数在策略由所提出的机制改变时始终增加。
首先,我们构建一个全序集来表示策略组合的变化。由于$A = U \cup S \cup E$和 $P$是有限的集合,因此集合 $F = { \varphi_x(P) : x \in A, P \in P }$也是有限的,其基数为 $F$,即$|F|$。 $\varphi_x(P)$在 $F$中的序记为 $o(\varphi_x(P), F)$。然后,我们定义一个函数,将 $P$映射到 $\mathbb{R}^{|F|}$, $\varphi^
_x(P) = (0,…, \varphi_x(P),…, 0)$,其中 $\varphi^
x(P)$的第$o(\varphi_x(P), F)$个元素为 $\varphi_x(P)$,其余元素为零。 $\varphi^
x$的范围记为$T \subset \mathbb{R}$。基于 $T$,可如下定义一个全序集 $(T,\geq_T)$:
$$
(a_1,…, a
{|F|}) \geq_T (b_1,…, b_{|F|}) \text{ iff }
a_i = b_i,\forall i \in {1,…,|F|}
\text{ or } a_m > b_m, \text{ where } m= \min { i: a_i \neq b_i}, (a_1,…, a_{|F|}), (b_1,…, b_{|F|}) \in T.
$$
现在,我们可以看到,如果$\varphi_x(P) > \varphi_{x’}(P’)$,那么对于$\forall k > 0$有$\varphi^
_x(P) >_k \varphi^*
{x’}(P’)$。
其次,通过上述性质,可以证明以下函数是$\mathbb{R}^{|F|}$上的广义势函数:
$$
\psi(P) = \sum_{x\in A} \varphi^
x(P).
$$
假设博弈的策略组合从 $P$变为 $P’$,这是由于参与者 $x$改变了策略,即 $P’ = P \oplus p’(x)$。这一变化可能会影响包含 $p(x)$和 $p’(x)$中参与者的有效三元组内玩家的收益,即 $p(x)$、 $p^{-1}(x)$、 $p’(x)$、 $p(y)$和 $p^{-1}(y)$中的参与者,其中 $y \in p’(x)$,如图2所示。基于抢占机制,我们有
$$
\varphi_x(P’) > \varphi_x(P), \varphi
{p’(x)}(P’) > \varphi_{p’(x)}(P),
\varphi_{p^{-1}(x)}(P’) > \varphi_{p^{-1}(x)}(P).
\tag{13}
$$
如果 $p^{-1}(x) \neq \emptyset$和 $p(x) \neq \emptyset$、 $x$、 $p^{-1}(x)$、 $p(x)$构成一个三元组,则它们具有相同的利润,即
$$
\varphi_x(P) = \varphi_{p(x)}(P) = \varphi_{p^{-1}(x)}(P). \tag{14}
$$
否则, $p^{-1}(x) = \emptyset$或 $p(x) = \emptyset$。这三个参与者不在一个三元组中,因此 $x$的变化不会影响他们。类似地
$$
\varphi_{p’(x)}(P) = \varphi_{p(p’(x))}(P) = \varphi_{p^{-1}(p’(x))}(P), \tag{15}
$$
根据不等式(13)、方程(14)和(15),我们有
$$
\psi(P’) - \psi(P) = \sum_{e\in A} \varphi^
e(P’) - \sum
{e\in A} \varphi^
_e(P) = \varphi^
x(P’) + \varphi^
_{p(x)}(P’) + \varphi^
{p^{-1}(x)}(P’) + \varphi^
_{p’(x)}(P’) + \varphi^
{p(p’(x))}(P’) + \varphi^
_{p^{-1}(p’(x))}(P’) - \varphi^
_x(P) - \varphi^
_{p(x)}(P) - \varphi^
{p^{-1}(x)}(P) - \varphi^
_{p’(x)}(P) - \varphi^
{p(p’(x))}(P) - \varphi^
_{p^{-1}(p’(x))}(P) > \varphi^
_x(P’) + \varphi^
_{p’(x)}(P’) - 3\varphi^
_x(P) - 3\varphi^*
{p’(x)}(P),
$$
由于 ${\psi(P): P \in P}$是有限的, $\psi(P)$中两个不同元素的差值具有下界。这表明 $\psi$不会持续增加,因此它是一个广义势函数。因此,根据定义1,3CG是一个势博弈。
通过引理2,我们可以推导出以下定理:
定理2. 3CG具有纯策略纳什均衡。
4.2 均衡的性质
3CG提供了一种SORA的近似方法。为了推导近似比,我们基于次模性质[19]证明3CG是一个有效效用系统,然后利用有效效用系统的推论[20]得到该近似比。
首先,为了证明3CG是一个次模博弈,我们定义一个社会效用函数 $\gamma$,该函数是次模博弈中的目标函数。
$$
\gamma(P) = \sum_{x \in E \cup S} \varphi_x(P) = 2 \sum_{x \in E} \varphi_x(P), \tag{16}
$$
其中 $\varphi_x$由(9)和(10)给出, $\gamma$是边缘节点和服务的总收益。我们记 $(\gamma,{\varphi_x})$ 为一个博弈社会效用 $\gamma$和一组收益 ${\varphi_x}$。由于边缘节点和服务处理相同的用户请求,我们推导出(16)中的第二个等价关系。
我们证明了社会效用函数是次模的。
引理3. 社会效用$\gamma$是非递减的且次模的。
证明。
我们证明 $\gamma$是非递减的。假设 $x$不在 $P$中选择任何策略,且 $p’(x)$是 $x$的策略,我们有
$$
\gamma(P \oplus p’(x)) - \gamma(P) = 2(\varphi_x(P \oplus p’(x)) - \varphi_x(P)).
$$
如果 $p’(x)$不在 $P$中的任何有效三元组中,那么 $x$将不会影响任何参与者。因此, $\varphi_x(P) = 0, \gamma(P \oplus p’(x)) - \gamma(P) > 0$。
如果 $p’(x)$在 $P$中的一个有效三元组中,则令 $p$表示在 $P$中与 $p(x)$相连的一个参与者。如果 $\varphi_x(P \oplus p’(x)) \leq \varphi_{p’(x)}(P)$,则 $x$的策略不会增加$p’(x)$的收益。因此, $x$将不会影响任何参与者和 $\gamma(P\oplus p’(x)) = \gamma(P)$。如果 $\varphi_x(P \oplus p’(x)) > \varphi_{p’(x)}(P)$,则 $x$将抢占 $p’(x)$。从而,
$$
\gamma(P \oplus p’(x)) - \gamma(P) = 2(\varphi_x(P \oplus p’(x)) - \varphi_{p’(x)}(P)) \geq 0.
$$
我们已经证明 $\gamma$在所有情况下都是非递减的。
然后,我们考虑 $\gamma$的次模性。一个集合函数$f: 2^V \to \mathbb{R}$是次模的,如果对于任意的 $A\subseteq B \subseteq V$和任意的 $x \in V - B$,满足 $f(A \cup {x}) - f(A) \geq f(B \cup{x}) - f(B)$。因此,我们定义策略配置 $P_1 \subseteq P_2$。假设 $x$在 $P_1$或 $P_2$中不选择任何策略,即$s^1_x = s_x = 0$,且 $p’(x)$是 $x$的策略。基于上述结果,我们有
$$
\gamma(P_2 \oplus p’(x)) - \gamma(P_2) = 2(\varphi_x(P_2 \oplus p’(x)) - \varphi_{p’(x)}(P_2)), \gamma(P_1 \oplus p’(x)) - \gamma(P_1) = 2(\varphi_x(P_1 \oplus p’(x)) - \varphi_{p’(x)}(P_1)).
$$
$p’(x)$有四种情况:(1) $p’(x)$不在 $P_2$或 $P_1$的任何有效三元组中;(2) $p’(x)$不在 $P_1$的任何有效三元组中,但存在于 $P_2$的一个有效三元组中;(3) $p’(x)$同时存在于$P_2$和 $P_1$的有效三元组中;(4) $p’(x)$不在 $P_2$的任何有效三元组中,但存在于 $P_1$的一个有效三元组中。由于我们已定义 $P_1 \subseteq P_2$,因此 $P_1$中的三元组也存在于 $P_2$中。因此,第四种情况不存在。因为$\varphi_x(P_2\oplus p’(x)) \leq \varphi_x(P_1\oplus p’(x))$,我们验证在其余三种情况下$\gamma(P_2\oplus p’(x)) - \gamma(P_2) \leq \gamma(P_1\oplus p’(x)) - \gamma(P_1)$为真。
我们已证明 $\gamma$在所有情况下都是次模的。
其次,我们证明博弈$(\gamma,{\varphi_x})$是一个有效的$(2, 0)$-效用系统[19]。
定义2(有效效用系统)
。效用系统$(\gamma,{\varphi_x})$是有效效用系统,当且仅当其具有以下性质
$$
\sum_x \varphi_x(P) \geq \gamma(P)
$$
定义3
$(K, T)$-效用系统。博弈$(\gamma, {\varphi_x})$是一个$(K, T)$-效用系统,当且仅当它具有以下性质
$$
\varphi_x(P) \geq \frac{1}{K} (\gamma(P) - \gamma(P \oplus (p(x) = 0))) - T
$$
其中 $P \oplus (p(x) = 0)$表示参与者 $x$在 $P$中退出其策略。
在$(K, T)$-效用系统中,参与者退出博弈所导致的社会效用损失可由该参与者的收益进行限定。
引理4。 上述定义的博弈$(\gamma,{\varphi_x})$ 是一个有效的$(2, 0)$-效用系统。
证明。
注意 $p(x) = 0$意味着参与者 $x$放弃其策略。如果 $x$在 $P$中的一个有效三元组中,则此操作仅使得与 $x$处于同一三元组中的服务器的收益为零。且在同一三元组中的参与者具有相同的利润。我们有$\gamma(P) - \gamma(P \oplus (p(x) = 0)) = 2(\varphi_x(P) - 0) = 2\varphi_x(P)$。如果 $x$不在 $P$中的任何有效三元组内,则 $S$中的参与者均不受影响。因此, $\gamma(P) - \gamma(P \oplus (p(x) = 0)) = 0$。 $x$的收益也为零,即 $\varphi_x(P) = 0$。我们有
$$
\varphi_x(P) \geq \frac{1}{2} (\gamma(P) - \gamma(P \oplus (p(x) = 0))).
$$
当$K = 2$和 $T = 0$时,满足 $(K, T)$-效用系统的性质。
第三,我们使用Vetta的结果[20]来确定近似比:
$$
\mathrm{OPT} \leq (1+ K)\gamma(P^
) + \left(kT - \sum_x (\gamma(P^
) - \gamma(P^
\oplus (P(x) = 0)))\right), \tag{17}
$$
其中$(\gamma, {\varphi_x})$是一个有效的$(K, T)$-效用系统, $P^
\in P$是一个纳什均衡。
由于我们博弈中的 $K = 2$和 $T = 0$,可以通过 $\gamma$的非递减性、引理4以及不等式(17)推断出以下比率。
定理3。
对于我们的博弈的任何纯策略纳什均衡 $P^
\in P$ $(\gamma, {\varphi_x})$,
$$
\gamma(P^
) \geq \frac{1}{3} \mathrm{OPT}
$$
最后,我们证明了3CG的近似比为 $1/3$。
5 性能评估
在本节中,我们通过数值研究来评估所提出的3CG的性能。我们首先随机生成边缘场景,然后将3CG与基线进行比较,并分析3CG的收敛性。最后,我们评估3CG的长期性能。
5.1 实验设置
我们首先考虑包含多用户、边缘节点和服务提供商的边缘场景。实验中考虑了两种资源:带宽(资源1)和计算(资源2)。在表2中,容量的参数均从给定的范围内均匀抽取。网络状况包括两个因素:延迟($n^{(1)}$)和带宽($n^{(2)}$),它们均从伽马分布中抽取。伽马分布可以生成一个正变量,该变量接近零或无穷大的概率较低,而延迟和带宽的分布也具有这一特性。然后,我们考虑来自用户的请求,服务请求包括带宽资源($b^{(1)}$和 $c^{(1)}$)、计算资源($b^{(2)}$和 $c^{(2)}$)。这两种资源对应的容量分别为 $r^{(1)}$和 $r^{(2)}$。这两种资源对应的分配分别为 $a^{(1)}$和 $a^{(2)}$。接着,我们构建三种场景,分别调整用户数量、边缘节点数量和服务数量。最后,我们定义函数 $Q$和$C$为
$$
Q(u, s, e) = \frac{a^{(1)}
{e,u}}{b^{(1)}_u} \cdot \frac{a^{(2)}
{e,u}}{b^{(2)}
u} \cdot \frac{a^{(1)}
{s,u}}{c^{(1)}
u} \cdot \frac{a^{(2)}
{s,u}}{c^{(2)}
u} \cdot e^{-n^{(1)}
{e,u} / 2000} \cdot e^{-n^{(2)}
{s,e} / 2000},
$$
$$
C(u, s, e) = \frac{1}{4} a^{(1)}
{e,u} + \frac{1}{4} a^{(2)}
{e,u} + \frac{1}{4} a^{(1)}
{s,u} + \frac{1}{4} a^{(2)}_{s,u}.
$$
5.2 纳什均衡性能
定理1表明,获得SOA的最优解是NP难的。因此,为了有效评估我们所提出机制的性能,我们将3CG与以下两种机制进行对比实现:
1) UPPER:一种估计算法,用于获得最优解的上界。由于求解SORA问题是NP难的,当问题规模较大时,无法在合理时间内完成最优解的计算。因此,我们使用最优值的上界来代替最优解。UPPER将所有边缘节点视为一个整体,并以最大利润为用户提供服务。2) 贪婪算法:服务被随机部署在边缘节点上,然后边缘节点选择能带来最高利润的用户。在贪婪算法中,服务提供商试图在更多边缘节点上部署服务,而边缘节点则试图为更多用户提供服务。3) EORA:来自[25]的方法,同时考虑了服务缓存和任务卸载。由于该EORA算法([25])不能直接适用于SORA问题,且若干环境设置不同,我们对其算法进行了修改,但保留了其关键解法。
纳什均衡性能从利润和成本两个方面进行衡量:
1)总利润 $\sum_{u\in U} \varphi_u(P)$,表示整个系统的总利润。2)总成本$\sum_{e\in E,u\in p(e),s\in p(u)} C(u, s,e)$,表示整个系统的资源总成本。3)被服务用户的平均利润$\sum_{u\in U} \varphi_u(P)/\sum_{e\in E} |U_e|$,表示用户满意度。4)用户服务率$\sum_{e\in E} |U_e|/|U|,$,表示被服务用户数与总用户数的比率。5)每个边缘的资源使用率,表示带宽和计算资源的使用状态。6)用户收益分配,反映分配方案的公平性。
总利润和成本。 三种场景下的总利润和成本如图3所示。总利润和成本反映了分配方案的整体性能。这些数值结果表明3CG具有最佳的整体性能,验证了定理3的正确性。图3a显示,随着用户数量的增加,利润也随之增长,直到边缘节点或服务提供商达到满载状态。与贪婪算法相比,3CG具有相似的总成本但总利润更大。UPPER表示最优解的上界,该上界在实际中无法达到。尽管在边缘节点和服务提供商满载时,UPPER的总利润远高于3CG,但由于UPPER总是耗尽所有资源,其成本也高得多。EORA的总利润最低,因为它未考虑服务提供商的影响。图3b显示,服务数量对总利润和成本的影响较小。在此场景下,EORA的总利润仍然最低。图3c显示,当边缘节点数量充足时,3CG的总利润高于贪婪算法且接近最优解。当边缘节点数量较少时,EORA能够实现更高的利润。然而,其成本也同样更高。
服务质量。 三种场景下被服务用户的平均利润和用户服务率如图4所示。平均利润代表用户满意度。在上述实验设置中,最大利润为1。由于资源限制,并非所有用户都能被服务,这一点通过用户服务率反映出来。图4a显示,随着用户数量的增长,用户满意度的上界保持稳定。我们提出的3CG的结果接近上界,且高于贪婪算法。随着用户数量的增长,3CG和贪心算法的服务率均随上界下降,这是因为用户超出了系统容量。图4b显示,随着服务提供商数量的增长,3CG在提升用户满意度和服务率方面均优于贪婪算法,而贪婪算法仅能提高服务率。由于更多的服务提供商意味着更多的用户偏好,这表明3CG能够有效协调用户请求。图4c显示,当系统资源容量增加时,32G提升了用户满意度。这表明3CG比贪婪算法能更充分地利用资源。随着资源容量的增长,3CG提高了服务率。当系统容量充足时,服务率接近上界。图4的结果表明,在平均利润这一指标上,EORA表现最差。在图4b中,随着服务提供商数量的增加,EORA的服务率增长高于贪婪算法和3CG。然而,EORA的平均质量仍然远低于其他方案。这表明,当服务提供商数量较多时,尽管每位用户的利润要低得多,EORA仍倾向于为更多用户u提供服务。
使用率。 不同设置下各边缘节点的带宽和计算资源使用率如图5所示。当部分用户无法被服务时,几乎所有边缘节点都会耗尽其资源。此外,当几乎全部用户都被服务时,边缘节点会有多余资源。这表明我们提出的3CG能够在资源充足时防止用户等待。图5还显示,在大多数边缘节点上,带宽和计算资源同时被耗尽。原因可能是边缘节点的带宽和计算容量是独立随机生成的。
收益分配。 用户收益分配反映了3CG的公平性。如图6所示,用户收益(利润)的分布接近正态分布。这表明3CG不仅实现了较高的整体性能,而且提高了每个用户的满意度。3CG试图减少低利润用户的数量。同时,3CG试图避免提高高利润用户的利润以节省资源。
5.3 收敛性分析
然后我们评估所提出的3CG算法的收敛时间。定理2已证明纯策略纳什均衡的存在性,即基于博弈的算法将在有限时间内结束。为了衡量收敛时间,我们使用博弈结束时决策时隙的平均数量。我们在不同设置下评估收敛时间,如图7所示。在图7a中,边缘节点数量固定为40,用户数量从100变化到3000,服务数量在 ${4,20, 100}$ 之间取值。结果表明,当用户数量小于约1500时,收敛所需的决策时隙数随着用户数量的增加而线性增加。考虑到边缘节点的平均容量和用户的平均所需资源,当用户数量大于1500时,所有边缘节点几乎都达到了满容量。因此,结果表明收敛时间不会随着用户数量的增加而持续增加。同时,结果还显示,随着服务提供商数量的增加,收敛所需的平均决策时隙数减少。这意味着更多的服务提供商提供了更宽松的稳定条件。
在图7b中,服务数量固定为20,用户数量从100变化到3000,服务数量在 ${10, 40, 70,100}$之间取值。结果表明,当边缘节点数量较大时,收敛时间增长更慢。这说明收敛时间的增长率取决于所有边缘节点的容量。
5.4 长期性能
上述评估考虑了3CG的单次运行性能,这意味着3CG始终从一个初始状态开始。然而实际情况是,在运行3CG进行资源分配时,博弈在上一次运行中已经收敛。连续运行的收敛时间可能与单次运行有较大差异。我们需要研究从一个纳什均衡到另一个新纳什均衡所需的决策时隙数量。因此,我们在上述三种场景中连续运行3CG,并让所有用户在每个时隙都改变其请求。这是一个极端情况,因为用户通常会保持其所请求的服务一段时间。
在图8a中,我们通过改变用户数量来评估长期性能。在50次运行期间,用户总收益几乎保持不变。并且用户数量首次运行后,决策轮次减少了三倍。当用户数量不太大时(|U < 2000),3CG将快速且稳定收敛。图8b显示服务数量对用户总收益没有影响。尽管看起来总利润变化剧烈,但其变化范围较小。此外,在长期运行过程中,所有情况的收敛速度相似。在图8c中,边缘节点数量对长期收敛的影响更大。与三幅图相比,我们可以看出服务提供商数量对收敛速度和总利润的影响小于用户数量或边缘节点数量。
在图8中,我们可以发现3CG的两个主要优势。首先,在长期运行过程中,用户的利润相当稳定。在所有场景中仅观察到小幅波动。这表明3CG能够持续提供高质量的资源分配方案。其次,持续运行显著减少了收敛时间。在达到首个纳什均衡后,决策轮次的数量至少减少了三倍以上,并保持稳定。这再次证明了3CG能够快速收敛。
5.5 对有效性的威胁
为了评估我们方法的有效性,我们采用总利润和总成本来评价方法的整体性能。同时,我们采用用户平均收益、用户服务率、每个边缘的资源使用率以及用户收益分配来评估方法的公平性。此外,我们研究了该方法的收敛时间。我们发现,在分布式实现我们的算法时会产生通信开销。然而,数值实验表明,我们的方法具有较低的通信和计算成本。为进一步解决此问题,我们的方法(算法1)可以在协调服务器上实现,而非在所有参与者上实现。协调服务器收集来自参与者的 $b_u$, $c_u$, $n_{u,e}$, $n_{e,s}$,并模拟博弈直至收敛。在这种集中式实现中,博弈过程中的通信时间可以忽略不计。
6 相关工作
边缘计算已随着一些新兴应用场景的发展而兴起,例如分布式机器学习[26],[27],虚拟/增强现实[15],[16],软件定义网络[28],虚拟网络功能[29],等。近期关于边缘计算中资源分配的研究主要集中在两个方面:工作负载卸载和基于博弈的方法。
6.1 面向资源分配的工作负载卸载
在边缘计算中,资源分配最常见的解决方案是将其表述为一种工作负载卸载优化过程,该方法已被许多先前的研究广泛采用[3]–[10],[13],[14],[14],[25],[30]–[34]。这些研究探讨了如何高效地将用户工作负载、任务或作业卸载到边缘节点或云上。例如,Dinh etal.[7]提出了一种从单个移动设备(MD)向多个边缘设备卸载的优化框架。Chen et al.[14]联合优化了所有用户任务的卸载决策以及计算和通信资源的分配。Tong et al.[3]扩展了用户‐边缘网络的结构,考虑了边缘和云中存在的分层结构。Li et al.[8]和Xiao et al.[6]提出了新的度量指标——结果质量与体验质量,用于衡量边缘计算中资源分配的性能。Xuet al.[25]同时考虑了边缘上的服务缓存与任务卸载。一些研究提出了新指标来评估边缘计算中资源分配的性能。Li etal.[8]识别出移动边缘计算中结果质量与服务响应时间之间的新权衡。Xiao etal. [6]同时优化了用户的体验质量和雾节点的能效。Wang et al.[9]考虑了用户可能迁移以及资源成本可能随机变化的情况。不同于上述离线分配方案,一些研究[4],[9]提出了在线卸载算法。在线卸载是资源分配的另一种重要机制。在[4],中,移动设备生成的作业被卸载至服务器,且存在上传和下载延迟。Wang et al. [9]考虑了用户可能移动以及资源价格可能任意变化的情况。这些研究通过多种方法改进了边缘计算中的资源分配。然而,它们仅考虑了从用户到边缘的工作负载卸载,即属于以边缘为中心的方法。在边缘计算中,用户工作负载通常用于完成不同的服务,而边缘可能需要来自服务提供商的支持。与我们的方法相比,这些研究未能建模这种面向服务的场景。
6.2 基于博弈的方法用于资源分配
资源分配场景通常被视为一个包含多用户与边缘节点的多智能体系统。因此,博弈论被广泛用于建模和分析资源分配问题[10],[12],[35]–[38]。博弈可以为资源分配提供近似与分布式算法。Chen etal.[10]提出了一种多用户计算卸载博弈,用于建模移动设备用户之间的分布式计算卸载决策问题。Josilo et al.[12]建立了一个博弈模型,证明了纯策略纳什均衡的存在性,并提供了一个用于计算均衡的多项式时间算法。He et al.[35]利用多玩家马尔可夫停止博弈对机会式资源共享进行建模。然而,大多数博弈模型集中在EORA以及用户与边缘节点之间的交互上。
从博弈的角度来看,一些研究已经注意到服务或服务提供商在用户与边缘节点之外也是不可忽视的角色。其中一些研究在定价或拍卖模型中将服务从边缘节点中分离出来。Maille etal.[39]在用户和边缘节点的基础上引入了内容提供商,并研究了数据从提供商传输到用户过程中的定价问题。Ghasemi etal.[40]将边缘节点视为服务提供商与用户之间的服务代理。Cui et al.[41]将资源分配视为匹配问题,并将分配问题转化为三边稳定匹配问题。这些博弈模型考虑了边缘计算中的三方角色,即用户、边缘节点和服务提供商。然而,它们主要关注定价或匹配,并未直接优化资源分配。我们的工作考虑了SORA问题,并提供了有效的解决方案。
7 结论
本文中,我们提出了面向服务的资源分配方法,能够更准确地描述边缘计算的服务范式。考虑到服务提供商的不同利益相关者和资源需求,我们构建了一个三方循环博弈,以寻求该NP难问题的近似解。然后,我们证明了所提出的3CG具有纯策略纳什均衡,且其近似比为1/3,相对于最优解。这些性质不依赖于效用函数的形式。此外,大量实验结果验证了所提出的算法的有效性和收敛性。在未来的工作中,我们计划在边缘计算测试平台上实现SORA,并通过人工智能方法进一步优化边缘资源分配。
1054

被折叠的 条评论
为什么被折叠?



