鲸鱼优化算法在无线资源分配中的应用

原创于 2025-10-27 03:23:33 发布 · 875 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#鲸鱼优化算法 #资源分配 #移动边缘计算 #功率分配 #二进制优化

鲸鱼优化算法在无线网络资源分配中的应用

摘要

资源分配在提升无线与通信网络性能方面起着关键作用。然而，资源分配的优化通常被建模为混合整数非线性规划（MINLP）问题，这类问题本质上是非凸且NP难的。由于传统方法存在诸多缺陷，例如全局优化的指数级计算复杂度、启发式方案无法保证性能最优性，以及基于机器学习的方法需要较长的训练时间和生成标准数据集，因此求解此类问题具有挑战性。鲸鱼优化算法（WOA）作为一种高效求解多种优化问题的方法，近年来受到研究界的关注。作为现有方法的一种替代方案，本文的主要目标是研究WOA在无线网络资源分配问题中的适用性。首先，我们介绍了WOA的基本原理及其二进制版本，并引入罚函数法以处理优化约束。然后，我们展示了WOA在无线网络资源分配中的三个应用实例：无线干扰网络中能量与频谱效率权衡的功率分配、安全吞吐量最大化的功率分配，以及移动边缘计算卸载。最后，我们探讨了将WOA应用于第五代移动通信系统及未来5G无线网络中各类潜在资源分配问题的前景。

索引词 —无线与通信网络，非正交多址接入，元启发式优化，边缘计算，资源分配，鲸鱼优化算法。

一、引言

A. 动机与相关工作

无线网络资源优化，例如频谱和能量效率的功率分配、正交频分多址（OFDMA）和多载波非正交多址接入（NOMA）中的子载波分配、时分多址（TDMA）中的时间分配、多接入边缘计算（MEC）中的计算卸载、云无线接入网络（C-RAN）中的远程射频头选择以及无线传感器网络中的簇头选择，通常被建模为混合整数非线性规划（MINLP）问题[1]，这类问题求解困难，通常是NP难的。已有多种优化和学习技术被提出用于求解这些混合整数非线性规划问题，其中一些方法如下：

1) 全局优化 ：一些算法，例如分支定界（BnB）和动态规划，可用于获得任何混合整数非线性规划问题[2]的全局最优解。然而，指数级最坏情况复杂度限制了它们在无线网络中的实现和应用，因为信道通常具有高度动态性，并且未来几年将出现大量具有蜂胞连接的物联网（IoT）设备。

2) 启发式方法 ：为了降低全局优化方法的指数计算复杂度，启发式算法在文献中被广泛使用。一种启发式算法的例子是将整数变量松弛为连续变量，并通过二次约束来近似二元约束。例如，子载波分配给设备到设备（D2D）对 $d$ 可以表示为 $x_{cd}$，其值在允许该D2D对复用蜂窝用户（CU）$c$ 的子载波时为 $x_{cd} = 1$，否则为 $x_{cd} = 0$ [3]。通过松弛，$x_{cd}$ 可以表示为 $\hat{x}_{cd} \in [0, 1]$，这可以理解为D2D对$d$复用来自CU$c$的子载波的时间比例。然而，低复杂度启发式算法的一个主要缺点是无法保证收敛至最优解，因此与最优方案相比的性能差距也无法保证。

3) 博弈论方法 ：博弈论为研究独立理性参与者之间的相互作用提供了一种数学工具。最近，博弈论已成为解决无线与通信网络中许多问题的重要工具。例如，联合匹配理论和联盟博弈被用于解决资源分配问题异构C-RAN与设备到设备通信[4]，以及基于无人机（UAV）通信的传输理论[5]。尽管博弈论具有实用性和广泛应用，但它基于理性响应，并依赖于可能影响博弈参与者策略和结果的数学模型，因此在某些场景中并不适用。

4) 基于机器学习（ML）的方法 ：机器学习最近被集成到无线与通信网络中，作为一种能够在性能和计算复杂度之间实现平衡的颠覆性技术[6],[7]。然而，存在一些任务可能会限制机器学习在无线网络中的应用。例如，为一个问题生成标准的训练数据集是一项非平凡的任务，有时甚至无法获得。此外，使用大规模数据集和大量参数来训练神经网络是一个耗时过程。

为提供一种可行的解决方案来应对无线通信中复杂的资源分配问题，我们的目标是利用元启发式算法。我们受到元启发式算法及其在许多大规模和现实世界工程优化问题中应用研究的启发，例如电气工程、土木工程、机械工程和工业工程。最近，Mirjalili等人提出了一种新的元启发式算法，即鲸鱼优化算法（WOA），该算法模仿座头鲸的捕食行为。座头鲸通常被视为捕食者，其主要食物包括磷虾和小鱼。座头鲸最著名的摄食方式之一是气泡网技术，这是仅在座头鲸中观察到的独特行为。在气泡网捕食过程中，座头鲸在一个收缩的圆圈中游动，并在猎物下方吹出气泡，迫使猎物向海洋表面聚集。已有研究表明，在几乎所有测试场景中，WOA的性能均优于最先进的元启发式算法，例如粒子群优化（PSO）、引力搜索算法（GSA）、遗传算法（GA）和蚁群优化（ACO）。在无线网络环境中，可将移动用户视作座头鲸，而优化变量的最优解则可视为猎物。通过模仿座头鲸的捕食行为，鲸鱼优化算法能够以高度竞争性的性能解决多种无线网络中的优化问题。最近，已提出了许多WOA的改进版本，例如WOA的二进制版本、探索与开发之间的权衡、混沌WOA以及用于优化神经网络的WOA。

WOA算法具有显著优势，可被视为一种高效优化器。首先，WOA无需计算梯度，这与基于梯度的算法不同，后者在优化过程中的每次迭代都需要计算并更新梯度和步长[19]。在存在大规模连接的情况下，异构移动设备（例如可穿戴计算设备、智能手机、物联网传感器设备和网络元件）、异构无线技术的融合以及众多新应用（例如虚拟现实、视频监控与分析和自动驾驶汽车）的出现，使得优化问题可能变得异常复杂。此外，由于依赖大量优化变量以及需要巨大的计算能力和内存，通常难以计算梯度。WOA可以避免此类计算，即WOA是一种无梯度方法。然而，作为一种基于种群的算法，由于在每一步优化中都需要使用目标函数评估多个解，其计算成本高于基于梯度的算法。其次，WOA对初始可行解不敏感，而传统方法的收敛性和性能可能受初始可行解的极大影响。接下来，WOA算法配备了能够适当平衡该算法探索性与开发性行为的自适应机制。这增加了避免局部最优解的可能性，这一点已在WOA原始论文中得到验证。最后，由于WOA易于实现且灵活，因此适用于广泛的优化问题而不局限于特定问题。这一优势使得WOA在无线与通信网络中具有高效性，因为在无线系统的优化中通常需要考虑大量的目标函数、性能指标和约束。

B. 我们的贡献

如前所述，WOA已在众多学科中取得了重要应用；然而，据我们所知，目前尚无研究探讨WOA在无线与通信网络中的应用及其适用性。本文的主要动机是研究WOA算法，并提供关于WOA算法的简明教程，同时讨论其在各类资源分配优化问题中的潜在应用。主要贡献可总结如下：

我们首先简要介绍了鲸鱼优化算法（WOA），包括其数学模型和优化算法。由于原始的WOA仅适用于连续且无约束的优化问题，我们提出了WOA的二进制版本（BWOA），并引入罚函数法来处理优化约束。将原始WOA与BWOA及罚函数法相结合，使我们能够求解广泛的优化问题，并获得高质量的解。
为了说明WOA的适用性，我们研究了无线网络中的三个资源分配问题：安全吞吐量最大化、能效与频谱效率权衡以及移动边缘计算卸载，并通过WOA算法求解这些问题。仿真结果表明，WOA算法能够非常快速地收敛，并达到与现有算法几乎相同的性能。
我们概述了WOA在无人机（UAV）轨迹优化、超密集网络（UDNs）中的干扰管理、用户关联与调度、模式选择以及支持多载波NOMA的MEC系统中的计算卸载等方面的潜在应用。结果验证了WOA是一种高度有前景的算法，可用于优化无线网络中的资源分配问题。

本工作的其余部分组织如下。第二节介绍了鲸鱼优化算法基础。第三节展示了三个鲸鱼优化算法在无线网络中应用的示例。接着，第四节讨论了鲸鱼优化算法的潜在应用。最后，第五节对本文进行了总结。

II. 鲸鱼优化算法：基本原理与二进制版本

本节讨论了WOA算法的基本原理，包括围捕猎物、气泡网捕食方法和搜寻猎物。随后介绍了WOA算法的二进制版本，最后引入罚函数法作为约束处理技术。

A. 包围猎物

座头鲸能够识别猎物（例如磷虾）的位置并将其完全包围。在WOA算法中，假设当前的最优搜索代理即为目标猎物，座头鲸在迭代过程中会向最优搜索代理更新其位置。以下方程用于对该行为进行数学建模
$$
D = |C \cdot (\vec{X}^ (t) - X(t))|,
$$
$$
X(t+1) = \vec{X}^ (t) - A \cdot D,
$$
其中 $A$ 和 $C$ 是系数向量，$t$ 是当前迭代，$\vec{X}^*(t)$ 是最优搜索代理的位置，$|\cdot|$ 是绝对值，$\cdot$ 表示逐元素乘法。系数向量 $A$ 和 $C$ 按如下方式计算：
$$
A = 2a \cdot r - a,
$$
$$
C = 2 \cdot r,
$$
其中 $a$ 在迭代过程中以及探索与开发阶段均从2线性递减至0，$r$ 是[0, 1]中的一个随机向量。记 $t$ 和 $I_{max}$ 分别为迭代索引和最大迭代次数，控制参数 $a$ 可更新为
$$
a = 2(1 - t/I_{max}).
$$
(3) 和 (4) 的主要目的是平衡探索与开发。这两个方程中的周长 $r$ 是随机的，为种群的位置更新提供了随机行为。在公式 (3) 中，随机数的范围从 2 减小到 0。当 $A \geq 1$ 时进行探索，当 $A < 1$ 时 WOA 进行开发。为了降低 WOA 在执行开发时永久陷入局部解的概率，参数 $C$ 可以是一个随机数。

对于最小化（最大化）问题，具有最小（最大）适应度值的搜索代理被视为最优搜索代理。

在[0, 2]中。这有助于在优化的任何阶段增强探索和开发能力。

B. 气泡网攻击方法

收缩包围和螺旋更新位置机制被同时用于模拟座头鲸的气泡网攻击方法。通过在[-1, 1]中设置系数向量 $A$，并在迭代过程中线性减少 $a$ 的值，从而实现收缩包围机制。通过这种方式，新位置将位于代理当前位置与最优搜索代理位置之间。

为了模拟座头鲸的螺旋形运动，可以使用如下猎物与鲸鱼位置之间的螺旋方程：
$$
D’ = |\vec{X}^ (t) - X(t)|,
$$
$$
X(t+1) = D’ \cdot e^{bl} \cdot \cos(2\pi l) + \vec{X}^ (t),
$$
其中 $b$ 是用于定义对数螺旋形状的常数，$l$ 是[-1, 1]中的随机数。

由于座头鲸在围绕猎物游动时既在一个收缩的圆圈内，又沿螺旋路径移动，因此同时使用了收缩包围方法和螺旋方法。为了模拟这种行为，假设每种机制以50%的概率执行，如下所示：
$$
X(t+1) =
\begin{cases}
\vec{X}^ (t) - A \cdot D, & \text{if } p < 0.5 \
D’ \cdot e^{bl} \cdot \cos(2\pi l) + \vec{X}^ (t), & \text{if } p \geq 0.5
\end{cases}
$$
其中 $p$ 是[0, 1]中的一个随机数。

C. 寻找猎物

收缩包围机制的相同方法也可用于猎物搜索。然而，此处使用系数向量 $A$ 和 $|A| > 1$，并且最优搜索代理的位置 $\vec{X}^*(t)$ 现在被替换为从当前种群中随机选择的一只座头鲸的位置 $\vec{X} {rand}$。换句话说，座头鲸被迫远离一只随机选择的鲸鱼，从而使WOA算法能够扩展搜索空间并执行全局搜索。猎物搜索的数学模型如下所示
$$
D = |C \cdot (\vec{X} {rand} - X(t))|,
$$
$$
X(t+1) = \vec{X}_{rand} - A \cdot D,
$$
值得注意的是，气泡网攻击方法和搜寻猎物分别对应任何元启发式算法中的两个阶段：开发能力和探索能力。气泡网攻击方法侧重于利用当前最优解在局部区域进行搜索，而搜寻猎物则是为了提高解的多样性，以获得全局解。随着迭代次数的增加，更希望增强开发能力，而在初始迭代阶段则更倾向于探索能力。在过去几年中，许多研究工作已经

算法1：WOA算法的伪代码。
1: 初始化鲸鱼种群 $X_i, i={1,…, N}$
迭代 $t= 1$, 最大迭代次数 $I_{max}$.
2: 计算搜索代理的适应度并识别最优搜索代理 $\vec{X}^ (t)$。
3: 重复
4: 对于 $k \leftarrow 1$ 到 $M$（鲸鱼数量）执行
5: 更新 $a, A, C, l$ 和 $p$。
6: 如果 $p < 0.5$ 那么
7: 如果 $|A| < 1$ 那么
8: 更新 $D$ 由(1)和 $X$ 由(2)。
9: else
10: 选择一个随机的 $\vec{X}_{rand}$ 并更新 $D$ 由(8)。
11: 更新位置 $X$ 通过(9)。
12: 结束 if
13: else
14: 更新 $D$ 通过(5) 和 $X$ 通过(6)。
15: 结束 if
16: 结束 for
17: 计算每个搜索代理的适应度。
18: 更新最优搜索代理的 $X^ (t)$。
19: 增加迭代索引 $t = t + 1$。
20: 直到 $t > I_{max}$ 或停止准则被满足。
21: Output：最优适应度值和最优鲸鱼位置。

致力于改进WOA，主要关注其开发能力与探索能力及其平衡。例如，[16]提出使用反正弦函数来控制探索与开发之间的权衡，并在[15]中利用莱维飞行轨迹来提高WOA的探索能力。采用此类WOA的改进版本来优化无线网络中的资源优化问题，是未来一个有趣的研究方向。总之，由于WOA算法在开发能力与探索能力之间具有良好的平衡，可被视为一种高效的全局优化器。

总之，WOA算法的伪代码在算法1中进行了说明。计算适应度函数的计算复杂度为 $O(ND)$，其中 $N$ 是鲸鱼种群，$D$ 是搜索代理的维度[13]。类似地，每次迭代更新所有搜索代理的位置向量所需的复杂度级别为 $O(ND)$。因此，算法1的复杂度可表示为 $O(NDT)$，其中$T$表示最大迭代次数/代数。

D. 二进制鲸鱼优化算法

WOA算法在其原始形式下适用于连续优化；然而，许多问题被表述为混合整数规划（MIP）问题，其中每个变量值可以是离散的或二进制的。为了处理组合优化问题，已提出WOA算法的二进制版本[13],[14]。BWOA算法的伪代码如算法2所示。值得一提的是，BWOA与其连续版本遵循相同的步骤

算法2：二进制鲸鱼优化算法的伪代码。
1: 初始化鲸鱼种群 $X_i, i={1,…, N}$
迭代 $t= 1$, 最大迭代次数 $I_{max}$,
并设置停止容差 $\varepsilon$。
2: 计算搜索代理的适应度并确定最优搜索代理 $\vec{X}^ (t)$。
3: 重复
4: 对于 $M$（鲸鱼数量）中的 $k \leftarrow 1$ 执行
5: 更新 $a, A, C$ 并生成 $p_{BWOA}$。
6: 如果 $p < 0.5$ 那么
7: 如果 $|A| < 1$ 那么
8: 更新 $D$ 由(1)给出，$\sigma_{sem}$ 由(10)给出。
9: 更新位置 $X(t)$ 基于 (11)。
10: else
11: 选择一个随机代理 $\vec{X} {rand}$ 并更新 $D$.
12: 通过 (14) 更新 $\sigma {sp}$ 并 $X(t)$ 通过 (15)。
13: 结束 if
14: else
15: 更新 $D$ 通过(5)和$\sigma_{sup}$通过(13)。
16: 通过(12)更新位置 $X(t)$。
17: 结束 if
18: 结束 for
19: 计算每个搜索代理的适应度。
20: 更新最优搜索代理 $X^ (t)$。
21: 增加迭代索引 $t = t + 1$。
22: 直到 $t > I_{max}$ 或 $\frac{|X^ (t)-X^ (t-1)|}{|X^*(t-1)|} <= \varepsilon$
23: Output：最优适应度值和最优鲸鱼位置。

除了位置向量的更新外，因此BWOA同样具有 $O(NDT)$ 的计算复杂度。

根据[13], WOA与BWOA之间的主要区别在于位置更新过程和转移函数。在WOA中，位置更新基于最优搜索代理的位置，并且可以在可行集中取任意连续值；而在BWOA中，位置更新基于在0和1之间的切换。当前位的变化由一个概率决定，该概率根据座头鲸的螺旋形运动计算得出。此外，转移函数中考虑了某些概念[20]：i) 由于转移函数表示位置从0变为1或从1变为0的概率，因此其值应位于[0, 1]内，以及ii) 转移函数应与座头鲸位置与猎物之间的距离成正比，即远离最优搜索代理的搜索代理应具有更高的概率。修改细节如下所述。

收缩包围机制 ：步长根据以下转移函数计算
$$
\sigma_{sem} = \frac{1}{1+ \exp(-10(A \cdot D -0.5))},
$$
其中 $D$ 和 $A$ 分别基于(1)和(3)计算得出。实际上，$\sigma_{sem}$ 可被视为一个用于确定位值是否应翻转的概率。

示意图0

更具体地说，要获得一个二进制数的按位取反，只需将该二进制数中的所有位反转，即把0变为1，1变为0。例如，当 $\sigma_{sem}= 0.45$ 且 $X(t)=[0 1 1 0 1]$ 时，如果随机数 $p_{BWOA}< \sigma_{sem}$，例如 $p_{BWOA}=0.34$，则下一个位置为 $X(t+ 1) = \neg(X(t))=[1 0 0 1 0]$；如果随机数$p_{BWOA} \geq \sigma_{sem}$，例如 $p_{BWOA}= 0.68$，则下一个位置为 $X(t+ 1)= X(t)=[0 1 1 0 1]$。

螺旋更新位置 ：在螺旋更新位置机制中的位置被计算为
$$
X(t+ 1)=
\begin{cases}
\neg(X(t)), & \text{if } p_{BWOA}< \sigma_{sup} \
X(t), & \text{if } p_{BWOA} \geq \sigma_{sup},
\end{cases}
$$
其中$\sigma_{sup}$是步长，可通过以下转移函数计算得出
$$
\sigma_{sup}= \frac{1}{1+ \exp(-10(A \cdot D -0.5))},
$$
此处，$A$ 和 $D$ 分别使用(3)和(5)计算得到。

搜寻猎物 ：步长计算为
$$
\sigma_{sp}= \frac{1}{1+ \exp(-10(A \cdot D -0.5))},
$$
其中 $A$ 和 $D$ 分别使用(3)和(8)计算得出。因此，搜索代理的位置按如下方式更新：
$$
X(t+ 1)=
\begin{cases}
\neg(X(t)), & \text{if } p_{BWOA}< \sigma_{sp} \
X(t), & \text{if } p_{BWOA} \geq \sigma_{sp}.
\end{cases}
$$
需要注意的是，可以使用不同的转移函数将连续搜索空间映射到离散动作。Mirjalili等在[21]中提出了六种转移函数，将其分为两类：S型和V-shaped。并评估了二进制粒子群优化（PSO）结合这些转移函数的性能。以S型类别为例，实际上采用具有不同斜率的sigmoid函数来构造S形传递函数，可表示为 $T_\alpha(\cdot)$，其中 $\alpha$ 为S形传递函数的斜率。例如，$T^{(2)}(x) = 1/(1+\exp(-2x))$，$T^{(1)}(x) = 1/(1+\exp(-x))$，以及 $T^{(1/2)}(x) = 1/(1+ \exp(-x/2))$。我们用 $x$ 表示座头鲸位置与猎物之间的距离。对于给定的距离 $x$，随着斜率 $\alpha$ 的增加，位值发生变化的概率也越高。因此，对于相同距离值 $x$，$T^{(2)}$ 返回的概率高于 $T^{(1)}$，而 $T^{(1/2)}$ 返回的概率最低。这一现象可以从图1中直观地观察到。有效利用这些转移函数可以进一步提升BWOA算法的性能。

E. 约束处理技术

由于原始WOA算法用于无约束优化，我们需要采用高效的约束处理技术以解决约束问题。Yang et al.在[22]中将约束处理技术分为两大类：1）经典方法，目前仍广泛以其独立形式使用；2）近期方法，基于进化思想与经典方法的混合。一些著名的约束处理方法包括罚函数法、容忍等式、可行性规则、目标与约束分离、随机排序、ε-约束方法以及多目标方法[22]。罚函数法是最简单且广泛使用的方法之一，其通过将目标和约束结合，试图将约束问题转化为无约束问题。下文将介绍罚函数法的基本原理。

考虑一个在所有可行的$x$中最小化 $f_0(x)$ 并满足 $m$ 个不等式约束和 $p$ 个等式约束的问题：
$$
\min_x f_0(x)
$$
$$
\text{s.t. } f_i(x) \leq 0, \forall i= 1,…, m,
$$
$$
h_i(x)= 0, \forall i= 1,…, p.
$$
罚函数可以定义为 $\varphi(x) = f_0(x) + P(x)$，其中 $P(x)$ 是惩罚项，可定义如下：
$$
P(x)= \sum_{i=1}^{m} \mu_i F_i(f_i(x)) f_i^2(x)+ \sum_{j=1}^{p} \nu_j H_j(h_j(x)) h_j^2(x).
$$
这里，$\mu_i \geq 0$ 和 $\nu_j \geq 1$ 是惩罚因子，通常为了便于实现，对所有不等式和等式约束均采用相同的值，即 $\mu_i = \mu \forall i$ 和 $\nu_j = \nu \forall j$。指标函数 $F_i(f_i(x))= 0$ 当 $f_i(x) \leq 0$ 且 $F_i(f_i(x)) = 1$ 当 $f_i(x) > 0$。类似地，指标函数 $H_j(h_j(x))= 1$ 当 $h_j(x) = 0$ 和 $H_j(h_j(x)) = 0$ 如果 $h_j(x) \neq 0$。扩展目标函数 $\varphi(x)$ 的目的是降低不可行解的适应度，但同时 $\varphi(x)$ 则倾向于可行解。从(17)可以看出，添加到解的适应度中的惩罚值主要由惩罚因子控制。值得一提的是，罚函数对某些问题具有良好的适用性；然而，选择合适的惩罚因子值却依赖于具体问题。根据[24]，如果惩罚因子过小，则不可行解可能无法获得足够的惩罚，从而在进化优化过程中被演化。如果使用过大的惩罚因子，则可能导致可行解的质量较低。此外，(WOA)算法鼓励对不可行解的探索，特别是当可行区域不连通时。通常情况下，惩罚因子 $\mu$ 和 $\nu$ 的取值范围为 $10^{13}$ 到 $10^{15}$。在下一节中，为了简化起见，所有约束的 $\mu$ 和 $\nu$ 均设为 $10^{14}$。一个有趣的研究方向是将鲸鱼优化算法与其它约束处理策略相结合，以解决更多约束问题并有望提升性能。

对于约束问题，鲸鱼优化算法的计算复杂度较高，且在很大程度上取决于等式与不等式约束的数量。计算对应于$p$个等式约束和 $m$个不等式约束的指标函数分别需要 $O(Np)$ 和 $O(Nm)$ 时间。将这些复杂度与原始鲸鱼优化算法的复杂度相加后，鲸鱼优化算法每迭代一次求解约束优化问题的计算复杂度为 $O(N(m+ p+ D))$。由于鲸鱼优化算法最多迭代 $T$ 次，因此其求解约束优化问题的计算复杂度为 $O(T N(m+ p+ D))$。

III. 鲸鱼优化算法在无线网络中的应用：示例

本节旨在提供一个关于鲸鱼优化算法（WOA）在无线网络中三个基本优化问题应用上的简明教程：最大-最小保密速率最大化、能效-谱效权衡优化以及移动边缘计算计算卸载。第一个示例展示了WOA在无约束连续优化问题中的应用，第二个示例针对约束连续问题，最后一个示例则针对混合整数非线性规划问题。第一个问题可直接通过WOA求解，第二个示例需要采用约束处理技术，而第三个问题则需借助分解技术和约束处理技术，通过BWOA进行求解。

A. 保密速率最大化的功率分配

1) 系统模型与问题建模

考虑一个具有 $M$ 个用户的干扰受限无线网络（IWN），每个用户可被视为一条通信链路，由单天线发射机和单天线接收机构成。记用户 $i$ 的发射功率为 $p_i$，用户 $j$ 到用户 $i$ 的信道增益为 $g_{ij}$。用户 $i$ 的数据速率为 $R_i(p) = \log_2(1+ p_i g_{ii} /(n_0 + I_i))$，其中 $I_i =\sum_{j=1}^{M} p_j g_{ij}$ 和 $p$ 为发射功率向量，$n_0$ 为噪声功率。假设存在一个单天线窃听者（EV），该窃听者被视为合法网络的一部分。用户 $i$ 在窃听者（EV）处的被窃听速率为 $\Gamma_i(p) =\log_2(1+ p_i g_{ei}/(n_0+ I_{ei}))$，其中 $I_{ei}=\sum_{j=1}^{M} p_j g_{ej}$ 和 $g_{ej}$ 表示从用户 $j$ 到窃听者（EV）的信道增益。用户 $i$ 的保密速率定义为 $\Phi_i(p) = \max{R_i(p) - \Gamma_i(p), 0}$。最大-最小保密速率（MMSR）问题可表述如下[25]：
$$
\max_p \Phi(p)= \min_{i=1,…,M}[R_i(p)- \Gamma_i(p)]
$$
$$
\text{s.t. } 0 \leq p_i \leq p_{\max}, \forall i= 1,…, M,
$$
其中 $p_{\max i}$ 表示用户 $i$ 的峰值发射功率。

2) 现有算法

与使用保密速率 $\Phi_i(p)$ 的d.c.（两个凹函数之差）表示不同，Sheng等在[25]中提出了一种路径跟踪程序来求解MMSR问题。在每次迭代 $t$ 中，数据速率 $R_i(p)$ 和被窃听速率 $\Gamma_i(p)$ 分别被一个下界 $R^{(t)} i(p)$ 和一个上界 $\Gamma^{(t)}_i(p)$ 所逼近。从一个可行解 $p^{(0)}$ 初始化后，在第 $t$ 次迭代中求解以下凸优化问题
$$
\max_p \Phi^{(t)}(p)= \min {i=1,…,M} \Phi^{(t)} i(p)
$$
$$
\text{s.t. } 0 \leq p_i \leq p {\max i}, \forall i= 1,…, M.
$$
路径跟踪程序将被迭代执行，直到满足停止准则 $\varepsilon$，即 $|( \Phi^{(t)} -\Phi^{(t-1)})/\Phi^{(t)}| \leq \varepsilon$。

3) 基于WOA的算法

最大最小保密速率（MMSR）问题是一个无约束的连续优化问题，因此可以直接应用原始WOA算法来求解。

4) 仿真结果与讨论

我们采用[25]中仿真的相同参数。路径跟踪程序的初始可行点 $p^{(0)}$ 被随机初始化，即 $p^{(0)} i = \rho(p {\max i} -p_{\min i}) + p_{\min i}$，其中 $p_{\min i}= 0$ 表示用户 $i$ 的最小发射功率，$\rho$ 是[0, 1]中的一个随机数。图2绘制了路径跟踪程序在[25]中的收敛演化以及所提出的基于WOA的算法随迭代索引的变化情况。如图2所示，两种算法均可快速收敛，路径跟踪程序需要12次迭代，而基于WOA的算法需要26次迭代。然而必须指出的是，在每次迭代中，路径跟踪程序都需要求解一个凸问题。由于近似凸问题(19)包含 $M$ 个优化变量（即 $p_i, i \in{1,…, M}$）和 $M$ 个线性约束（即 $0 \leq p_i \leq p_{\max i}, i \in{1,…, M}$），因此路径跟踪程序在本文考虑的网络场景下的计算复杂度为 $O(T(M^2 M^{2.5}+ M^{3.5}))$，其中 $T= 12$。与基于WOA的算法在每次迭代中不同的是，用户（即WOA中的座头鲸）跟随最优搜索代理来更新它们的发射功率，同时更新迄今为止获得的最优搜索代理的发射功率。如第二节-C所述，WOA在无约束问题上的计算复杂度为 $O(NMT)$，其中 $T= 26$ 且 $N= 30$（N为搜索代理数量）。因此，基于WOA的算法具有低计算复杂度的优势

示意图1
示意图2 收敛演化)
示意图3 能量效率与最低要求速率的关系)
示意图4 卸载用户比例)
全系统计算开销)
系统效用)

与现有方案相同。综上所述，基于WOA的算法以非常低的计算复杂度实现了竞争性性能。

C. 移动边缘计算卸载

1) 系统模型与问题建模

考虑一个包含一个与eNB共址的多接入边缘计算服务器和 $M$ 个用户的多接入边缘计算场景。每个用户都有一个计算任务 $I_i ={D_i, C_i}$，其中 $D_i$ 为输入大小（单位：比特），$C_i$ 为完成该任务所需的CPU周期数。用 $a_i$ 表示用户 $i$ 的卸载决策，其中当任务 $I_i$ 被卸载时 $a_i = 1$，否则 $a_i = 0$。

用户 $i$ 的完成时间和能耗可表示为 $T_i = a_i T^r_i +(1 - a_i) T^l_i$ 和 $E_i = a_i E^r_i +(1 - a_i) E^l_i$，其中 $T^l_i/T^r_i$ 和 $E^l_i/E^r_i$ 分别为任务 $I_i$ 在本地/远程执行时用户 $i$ 的任务完成时间和能耗。根据[28], $T^l_i, E^l_i, T^r_i$ 和 $E^r_i$ 可表示为 $T^l_i= C_i/f^l_i$，$E^l_i= \alpha(f^l_i)^\gamma C_i$，$T^r_i= C_i/f_i+ D_i/R_i$ 和 $E^r_i= D_i p_i/\varsigma R_i$，其中 $f^l_i$ 是用户 $i$ 的本地计算能力，$\alpha= 10^{-11}$，$\gamma= 2$，$f_i$ 是多接入边缘计算服务器分配给用户 $i$ 的计算资源，$\varsigma$ 是功率放大器效率，$R_i$ 是用户 $i$ 的数据速率。在子载波分配为正交且预定义的假设下，数据速率 $R_i$ 表示为 $R_i(p_i) = W \log_2(1+ p_i h_i/n_0)$，其中 $h_i$ 是从用户 $i$ 到演进型节点B的信道增益。

为了最大化计算卸载在完成时间和能耗方面的改进，总体效用可以定义如下：
$$
v_i(a_i,p_i, f_i)= a_i\left(\beta^t_i \frac{T^l_i - T^r_i}{T^l_i} + \beta^e_i \frac{E^l_i - E^r_i}{E^l_i}\right)
$$
其中 $\beta^t_i$ 和 $\beta^e_i$ 分别为用户对完成时间和能耗的偏好。优化计算卸载决策和资源分配以最大化总体效用的问题可表述如下[28]：
$$
\max_{a,p,f} \sum_{i=1}^{M} v_i(a_i,p_i, f_i)
$$
$$
\text{s.t. } C1: a_i={0, 1}, \forall i= 1,…, M,
$$
$$
C2: 0 \leq p_i \leq p_{\max i}, \forall i= 1,…, M,
$$
$$
C3: f_i> 0, \forall i \in S,
$$
$$
C4: \sum_{i\in S} f_i \leq f_0,
$$
$$
C5: \sum_{i=1}^{M} a_i \leq N,
$$
其中，$S={i= 1,…, M | a_i= 1}$ 是卸载用户集合，$f_0$ 是多接入边缘计算服务器的最大计算资源，$N$ 是子载波数量，表示允许 $N$ 个用户卸载其计算任务。问题(24)中的约束条件C3和C4表明，多接入边缘计算服务器仅向卸载用户提供计算资源，且分配的总资源不得超过最大计算能力 $f_0$。

2) 现有算法

由于问题(24)是NP难的，文献[28]中的作者提出将原问题分解为两个子问题。第一个子问题（JCCR）是针对给定的卸载决策 $\hat{a}$ 优化计算和通信资源，如下所示：
$$
\max_{p, f} \sum_{i \in S} v_i(\hat{a} i,p_i, f_i) \quad \text{s.t. } C2, C3, C4.
$$
第二个子问题（COD）是在给定 $(\hat{p}, f)$ 的情况下优化卸载决策 $\hat{a}$，可以表示为
$$
\max_a \sum {i \in S} v_i(a_i, \hat{p}_i, \hat{f}_i) \quad \text{s.t. } C1 \text{ and } C5.
$$
对于给定的 $\hat{a}$，发射功率 $p$ 和计算资源 $f$ 相互解耦；因此，JCCR子问题可进一步分解为 $p$ 和 $f$ 两个独立的问题。然后，$p$ 和 $f$ 的解可以分别求解使用凸优化和二分法。结果表明，COD子问题的目标是一个子模优化问题，因此卸载决策 $a$ 通过基于子模优化的启发式算法求解。

3) 基于WOA的算法

为了评估BWOA算法的有效性，并公平地比较基于BWOA的算法与现有算法的性能，我们提出采用分解技术将 $a$ 和 $(p, f)$ 分解为两个子问题。其中，JCCR子问题采用与[28]相同的方法求解，而COD子问题则利用BWOA算法求解，以获得卸载决策的解决方案。值得注意的是，本小节致力于求解二值优化问题(26)，这与第三节-A和第三节-B中使用WOA算法求解连续优化问题的情况相反。事实上，可以结合WOA与BWOA来求解原始问题(24)。然而，此类算法并非本文的研究重点，因此在本文中予以省略。感兴趣的读者可参考[29]及其相关文献，了解利用粒子群优化在D2D通信中信道分配与功率控制的优化方法。

为处理不等式C5，一种直接的方法是检查约束C5是否满足。如果约束条件满足，则该解是可行的，可以进行适应度函数的评估。一旦违反约束，该解将被舍弃，并需采用一个新的解继续。显然，这种方法速度慢且效率低下。为了获得更好的性能，可采用罚函数法，将适应度函数定义如下：
$$
\text{Fitness}(a)= -\sum_{i \in S} v_i(a_i, \hat{p} i, \hat{f}_i) + \mu F(f(a)) f^2(a),
$$
where $f(a)=\sum {i=1}^{M} a_i - N$.

4) 仿真结果与讨论

我们进行了实验，以系统效用方面的性能进行比较，系统范围（即总）计算开销以及卸载比例，在所提出的基于WOA的算法与启发式卸载决策算法（HODA）之间进行比较，如[28]所示。这些指标均在收敛解处进行评估：1）系统效用定义为优化问题(24)的目标函数；2）系统范围计算开销定义为 $Z_{\text{tot}}=\sum_{i=1}^{M} \left((1 - a_i) \beta^t_i T^l_i+ \beta^e_i E^l_i+ a_i (\beta^t_i T^r_i + \beta^e_i E^r_i)\right)$；3）卸载比例定义为卸载用户数量与总用户数之比，即 $P_{\text{off}}= a^T \mathbf{1}/N$。实验中使用了与HODA相同的仿真参数集[28]。此外，每张图的结果均为200次实现的平均值，且每次实现中用户随机放置。

图4显示，随着用户数量的增加，两种算法面对的用户范围更广，这些用户具有不同的信道条件、本地计算能力和计算任务，因此它们能够在系统效用上提供持续的提升。由于每个用户需要与其他更多用户竞争计算卸载资源，而子载波数量有限，部分用户即使能从远程执行中获益，也无法进行卸载。因此，卸载比例和全系统计算开销均随着用户数量的增加而上升。基于WOA的算法具有较低的复杂度级别 $O(N(1+ M))$（无等式约束，仅有一个不等式约束C5），相比之下，HODA和最优解的复杂度分别为 $O(M^3)$ 和 $O(2^M)$。从图4可以看出，基于WOA的算法性能非常接近启发式集中式HODA[28]所达到的解。当用户数量为 $M= 8$ 时，基于WOA的算法获得的系统效用为1.731，而HODA实现的系统效用为1.7311。此外，[28]通过仿真验证了HODA能够使其性能保持在穷举搜索得到的最优解的5%以内。因此，WOA在低计算复杂度下表现出较强的竞争力。

通过上述三个示例，我们充分证明了WOA是解决无线与通信网络中各种资源分配问题的一种有前景的工具。所有实验表明，基于WOA的算法能够获得与现有具有收敛保证的算法几乎相同性能的解。这是合理的，因为在优化过程中探索与开发能力均得到了发展，因此WOA可被视为一种全局优化器。

IV. 鲸鱼优化算法在无线网络中的潜在应用

尽管鲸鱼优化算法（WOA）在无线网络中的应用尚未被探索，但前一节中的三个示例确实证明了基于WOA的算法的有效性。在接下来的几个小节中，将讨论WOA在无线网络中的一些潜在应用。通过这些讨论，我们期望WOA将成为优化未来无线系统的有效工具，其中将涌现出许多新技术、新服务和新型网络架构，例如联邦学习、智能反射面、无小区大规模多输入多输出（MIMO）、全息与太赫兹通信。关于第五代移动通信系统（5G）网络的全面综述以及对第六代移动通信系统（6G）的前瞻性研究，我们邀请读者参阅[30],[31]及其参考文献。

A. 多载波NOMA中的MEC卸载

随着新型计算密集型和高能耗移动应用的出现，小型用户（例如物联网设备）倾向于将其计算任务卸载到集中式云和/或边缘服务器（例如雾节点和MEC服务器），以降低完成延迟和能耗[7],[32]。传统上，计算卸载通过在服务器与用户之间的传输中应用正交多址接入（OMA）方案来实现。例如，在时分多址TDMA-MEC（OFDMA-MEC）中，用户以正交方式被分配一定比例的时间（或一个子载波）将其任务卸载至MEC服务器。然而，当大量用户试图通过有限数量的正交子载波执行计算卸载时，该方法在MEC系统中可能效率低下。将NOMA引入MEC不仅可以避免严重的延迟，还能降低能耗[33]。与OMA-MEC中的传统问题相比，NOMA-MEC中的计算卸载与资源分配（例如通信与计算资源）联合优化问题因NOMA的独特特性（如用户聚类和解码顺序）而变得更加复杂。由于此类问题通常难以直接求解，大多数关于MEC的研究考虑将原始问题分解为多个较小的子问题，并交替迭代地求解这些子问题，直到获得最终解或满足停止准则为止。

WOA应用于解决NOMA-MEC中计算卸载与资源分配联合问题的适用性非常直接。使用基于优化的方法，需要分析所考虑问题的特性以及网络场景，需要针对特定问题采用具体方法。相比之下，WOA可应用于广泛的计算卸载问题，其结果可作为衡量与其他方法性能比较的基准。一种可行的方法是直接应用WOA来求解联合问题，其中原始WOA处理连续变量，例如功率分配、计算资源分配和本地计算能力控制，而二进制WOA解决二进制变量，例如卸载决策、子载波分配和NOMA簇选择。另一个有前景的方向是将问题分解为更小的子问题，其中一些子问题使用博弈论和凸优化等传统方法求解，其余子问题则使用WOA求解。我们的第三个示例清晰地说明了这一方向。具体而言，我们提出将功率控制、计算资源分配和卸载决策的联合优化分解为三个子问题，然后利用BWOA算法求解卸载决策，并使用凸优化求解发射功率和计算资源分配。

B. 干扰管理

在无线网络中，干扰管理（IM）已成为一个基础性的优化问题，有助于实现许多目标，如吞吐量最大化、能量/计算效率、服务质量保障和网络规划。在超密集网络（UDNs）中，干扰管理问题变得更加严重和复杂，因为在小范围内可能存在大量共存的干扰节点（例如，用户、接入点和eNB）。如果没有适当的干扰管理方案，网络性能可能会显著下降，同时大量资源可能被浪费。此外，干扰管理与资源分配以复杂的方式紧密交织在一起。

通常，干扰管理在数学上被表述为非凸的NP难优化问题，文献中常用的方法是寻找近似最优解，而这有时无法保证最终收敛到最优值。显然，此类问题可以借助约束处理技术，利用WOA算法来求解。对于给定的优化问题，可通过将约束条件整合到目标函数中，从而安全地避免约束问题。作为一种全局优化器，WOA有望使特定资源分配问题的性能在所提出的算法中具有很强的竞争力。

C. 用户关联与D2D模式选择

除了干扰管理外，用户关联（UA）对于提升超密集网络中的网络负载均衡、频谱和能源效率也具有重要意义。用户关联旨在决定用户应连接到哪个演进型节点B[35]。众所周知的用户关联方案基于一些基本指标，例如信噪比和接收信号强度指示。与前几代不同，第五代移动通信系统不仅提供通信，还将提供计算、缓存和控制；因此，存在许多更多可用于生成高效用户关联（UA）解决方案的指标，例如中断和覆盖概率、频谱/能量效率、服务质量（QoS）、公平性、计算感知能力以及缓存感知内容[32],[36]。

设备到设备通信是一种有前景的方法，可通过短距离提供高速数据服务，从而提升第五代移动通信系统网络的性能[3],[29]。通过模式选择，D2D对中的两个用户可在两种模式之间进行选择：一种是复用蜂窝用户的子载波进行直接通信，另一种是作为普通蜂窝用户通过演进型节点B进行间接通信[37]。在非授权LTE中，模式选择可视为D2D对选择其直接通信所使用的频谱（即授权或非授权频谱）的决策问题[29]。D2D模型选择与子载波分配的联合考虑通常被建模为混合整数规划问题。

在现有先进方法中，匹配理论、联盟博弈和图论被认为是最具前景的技术，这些技术试图在合理的时间内以较低的计算复杂度找到二进制高质量解，相较于穷举搜索更具优势。WOA为解决此类问题提供了另一种途径。尽管尚无收敛性证明，但数值结果可用于确认二进制鲸鱼优化算法的有效性。我们在第三个示例中的演示表明，WOA算法能够实现与启发式集中式方案几乎相同的性能。

D. UAV轨迹优化

无人机轨迹的优化已受到研究界的广泛关注，作为一种提升无人机系统性能的方法[7],[38]。然而，无人机的轨迹受到多种因素的显著影响，例如飞行时间、能量约束、碰撞避免、计算效率以及能量收集因果性。一种常见的无人机轨迹优化方法是将传输周期 $T$ 离散化为 $N$ 个不同的时隙，并假设无人机在每个时隙内的位置近似保持不变[39]。通过这种方式，可以通过应用逐次优化技术来联合优化轨迹和资源分配问题，即：在给定轨迹下求解资源分配问题，然后在给定资源分配向量下更新轨迹，这两个阶段交替迭代执行，直到满足停止准则为止。

尽管如此，每个时隙内需要求解的优化问题通常是非凸的，且其求解大多依赖于凸近似和启发式方法。由于WOA具有显著优势，可以考虑将其应用于求解轨迹优化问题，预计WOA算法在解的质量和收敛速度方面将比现有机制更胜任无人机轨迹的优化。

五、结论

我们介绍了鲸鱼优化算法（WOA）的基本原理及其在资源分配中的应用在无线与通信网络中。为了展示鲸鱼优化算法（WOA）在无线与通信网络中的适用性，我们研究了三个问题，并展示了部分初步结果。同时，还强调了其在NOMA-MEC系统中的潜在应用、异构网络中的干扰管理、超密集网络中的用户关联、D2D通信中的模式选择以及无人机系统中的轨迹优化等潜在应用场景。

由于WOA在无线和通信网络中的应用尚未被探索，且基于WOA的算法相较于最先进的算法具有竞争性性能，因此当有人提出针对任何优化问题的自有方法时，WOA可作为性能比较的基准。我们希望本文能作为在无线网络资源分配以及其他工程领域中采用WOA进行优化的初始参考文献。