EdgeLSTM：边缘计算中的时序分析-优快云博客

EdgeLSTM：面向深度和序列化边缘计算的物联网应用

摘要

物联网（IoT）中大规模传感器产生的时间序列数据具有极强的动态性、异构性、大规模性和时间依赖性，对各类物联网应用的实时分析与决策提出了巨大挑战（例如准确率、可靠性、稳定性）。本文设计、实现并评估了EdgeLSTM，这是一种统一的数据驱动系统，旨在增强网络边缘的物联网计算能力。EdgeLSTM利用网格长短期记忆（Grid LSTM）为深度与序列计算提供敏捷的解决方案，从而有效应对物联网数据的大规模、多样性、时间依赖性和实时性等关键特征。本系统充分利用网格LSTM网络的优势，并通过严格的正则化和优化方法将其扩展为多类支持向量机，不仅具备强大的时间序列数据预测能力，还能通过预测误差实现细粒度的多分类。我们通过大量实验将EdgeLSTM部署于四种物联网应用中，包括数据预测、异常检测、网络维护和移动性管理。在这些典型物联网应用中，基于具有不同短期和长期时间依赖性的实际时间序列数据的评估结果表明，我们的EdgeLSTM系统能够在物联网计算中保证鲁棒的性能表现。

索引术语

时间序列，边缘计算，物联网。

一、引言

INTERNET 物联网在智慧城市、工业4.0、供应链和家庭自动化中的应用产生了海量数据。根据思科的一份报告，联网的物联网设备数量将达到116亿台到2021年，将产生每月49艾字节以上的数据流量[1]。数据传输与处理在物联网应用中起着关键作用，因为无处不在的传感器[2]–[4]产生了大量数据和信息。随后，可以从中提取出高度有用且有价值的信息，以实现这些物联网应用的智能自动化与决策。由于数据驱动的物联网应用对低延迟甚至实时特性的需求[5]–[7]，边缘计算[8]–[10]最近作为一种解决方案应运而生，能够在网络边缘即物联网数据源附近进行数据处理与智能分析。同时，由于物联网数据由分布式智能设备和传感器生成，其时间依赖性特征是与传统数据最显著的区别。因此，亟需一种高效系统来在边缘对物联网时间序列数据进行分析和处理[11],[12]。

A. 挑战

时间序列是按时间顺序排列的一组数字。由大规模传感器产生的时间序列数据正成为物联网计算中最普遍的数据形式[13]。时间依赖性是物联网数据的一个非常重要的特征，对数据预测和分析具有重要影响。例如，当前时间点的数据可能与之前的时间点或遥远的过去某个时间点的数据相关。这被称为短期和长期时间依赖性[14]。有必要设计一种可行的方法，以充分利用这一特征服务于物联网应用，因为现有的时间序列方法在同时处理短期依赖和长期依赖时存在低效率问题，如第六节所述。

此外，许多数据驱动的物联网应用对延迟、可靠性和安全性有严格要求。由于受限于有限带宽和计算资源，物联网需要预加载流量。因此，它需要部署一个平台，该平台在网络边缘集成连接、计算、存储和应用能力。边缘计算范式应运而生以满足此类需求。如图1中物联网应用的边缘计算所示，由各种传感器收集的物联网数据通过交换机、路由器和其他无线网络传输到边缘。这些数据在各种边缘节点（e.g.手机、笔记本电脑、无人机、车辆）中进行存储和处理，处理后的结果可被特定的物联网应用后续使用。

在边缘辅助的物联网计算中，如图1所示的统一学习与分析有望在边缘部署，以解决物联网时间序列数据的以下问题：（a）大规模。大量传感器数据由分布式物联网设备收集，且持续不断地产生大量传感器数据。（b）多样性。由于存在多种数据采集设备，因此在物联网中所收集的数据类型也各不相同。（c）时间依赖性。物联网中由部署在特定位置的设备采集的传感器数据带有时间戳，数据流是对连续物理现象的测量，其内部具有固有的时间依赖性。（d）实时性。所收集的数据应立即进行处理，以确保数据的有效性。例如，若某个传感器设备运行异常，则需要立即检测，以避免影响其他设备的正常运行。

B. 我们的方法

受谷歌DeepMind近期成功利用长短期记忆（LSTM）单元的计算功能开发出具有哺乳动物般导航能力的人工智能体的启发，本文设计、实现并评估了一个名为EdgeLSTM的统一系统，以解决上述四个问题。

EdgeLSTM系统能够学习物联网时间序列数据的多维特征，并在网络边缘提供敏捷稳定的处理能力。EdgeLSTM的核心思想是将LSTM单元扩展到网格结构，并利用网格LSTM[14]对物联网时间序列数据进行深度计算。

网格LSTM沿任意或所有维度（包括网络深度）部署单元。在序列预测的背景下，EdgeLSTM沿两个维度部署单元：序列本身的时间维度和沿网络深度的垂直维度。因此，与标准LSTM网络相比，EdgeLSTM能够更好地处理具有更复杂特征和分离相互依赖性的数据，例如在边缘节点具有实时需求的物联网计算，用于分析动态、大规模、时间相关和高维数据。

具体而言，我们的EdgeLSTM系统使用网格LSTM神经网络来预测时间序列数据的趋势。为了防止模型过拟合并提高泛化性能，采用了多种正则化技术来训练模型。然后，根据预测数据值与真实数据值之间的差异构建误差数据集，并用于训练多类支持向量机（SVM）[17]以执行数据分类。我们的EdgeLSTM系统能够充分发挥边缘计算的潜力，以支持数据驱动的物联网应用。

C. 贡献

通常，我们的贡献总结如下：
- 我们设计并实现了EdgeLSTM作为一个统一的基于数据驱动的网络系统，用于分析大量实时网络数据并优化网络性能。通过在物联网边缘进行数据驱动处理，可以改善网络系统的管理。基于数据驱动范式设计的新网络协议有望通过利用比单一流量更多的数据，显著实现更优的性能。
- 我们提出了一种在EdgeLSTM中使用特定网格网络结构的预测模型，以应对物联网时间序列数据的挑战。该模型可扩展LSTM单元以实现深度与序列计算，从而处理多维特征并应对短期和长期时间依赖性。我们利用网格LSTM网络在数据预测方面的优势，并使用预测值与真实值之间的误差来训练一个多类SVM，该SVM通过最大胜出投票策略实现多分类。通过这种方式，Grid LSTM预测模型与多类SVM模型的优秀分类能力紧密结合，符合物联网数据的时间序列特性。
- 我们将EdgeLSTM应用于四种数据驱动的物联网应用，分别是数据预测、异常检测、网络维护和移动性管理。在多个具有不同短期和长期时间依赖性的真实世界数据集上进行的大量实验表明，同时在时间和深度维度上设置单元的LSTM比不设置单元的LSTM更有效；e.g.在移动切换场景中，与现有最先进工作相比，吞吐量提升24.33%且延迟降低38.03%。

需要注意的是，EdgeLSTM模型在多个方面优于我们之前的工作LSTM‐高斯‐朴素贝叶斯模型[18]，该模型使用堆叠LSTM来预测物联网数据集，并利用高斯朴素贝叶斯实现二分类。堆叠LSTM单元在从一层到下一层的垂直计算中扩展性较差，因此难以学习多维特征，影响了错误数据集的分类结果。在分类方面，高斯朴素贝叶斯仅能实现二分类，无法很好地扩展以支持多类分类。与LSTM‐高斯‐朴素贝叶斯模型的结构不同，EdgeLSTM模型采用网格LSTM单元构建预测基础，并结合多类SVM实现多类异常检测。网格结构具备深度和序列处理能力，在真实世界物联网数据预测中更显著地提取多维特征，并且相较于堆叠LSTM，能够自然地与多类SVM耦合，用于分类多种类型的物联网异常。

本文的其余部分组织如下。第二节介绍了长短期记忆网络的预备知识。第三节给出了EdgeLSTM系统的概述。第四节详细描述了EdgeLSTM方法。第五节展示了实验结果。第六节总结了相关工作。第七节总结了我们的论文。

II. 长短期记忆网络初步

长短期记忆网络（LSTM）可追溯到循环神经网络（RNN）。最简单的RNN架构存在梯度消失（和爆炸）问题，导致误差无法被适当反向传播。为缓解此问题，LSTM网络[14],[15],[18]在网络中建立了一条数据传输通道，通过线性映射将数据从一个时间戳传递到另一个时间戳。LSTM通过在RNN的隐藏向量h之上引入一个记忆细胞向量m，从而扩展了RNN模型。

长短期记忆网络包含四个“门”，分别表示为gu、gf、go和gc。遗忘门gf可以丢弃一些先前不必要的记忆信息mi−1，而与之相对的是输入门gc，它可以通过输入门gu调节将新信息添加到新的记忆mi中。输出门go决定下一个隐藏状态hi应该是什么。给定一个输入和目标对序列(x1, y1)…,(xm, ym)。对于每一对(xi, yi)，长短期记忆网络将xi作为新的输入，并基于所有先前的输入x1,…, xi，对目标yi生成预测值ˆyi。从数学上讲，长短期记忆网络的过程可以表述如下[14]：

$$
g_u = \sigma(W_uH) \
g_f = \sigma(W_fH) \
g_o = \sigma(W_oH) \
g_c = \tanh(W_cH) \
m’ = g_f \circ m + g_u \circ g_c \
h’ = \tanh(g_o \circ m’)
$$

其中 $\sigma(*)$ 是将数值压缩在0到1之间的sigmoid激活函数。这在更新或遗忘数据时非常有用，因为任何数乘以0都为0，从而导致数值被“遗忘”（消失）；而任何数乘以1仍保持原值不变，因此网络可以学习哪些数据需要“保留”。R d×2d中的Wu、Wf、Wo和Wc是循环权重矩阵，H=[I ∗ xi,·,h]T ∈ R 2d是由新输入 xi（通过投影矩阵 I变换）和先前的隐藏向量h拼接而成。

III. EdgeLSTM系统概述

鉴于长短期记忆网络（LSTM）能够追踪时间依赖性，我们提出了一种新系统，该系统利用其优势，并通过多维网格LSTM扩展其结构，专门用于处理和估计物联网时间序列数据。

示意图0

如图2所示，在所提出的系统中，我们首先对初始数据进行处理，包括数据清洗、数据降采样和数据归一化。然后，将预处理后的数据划分为训练集、验证集和测试集，其中训练集和验证集仅包含正常数据。接着，分别利用这些数据集来优化和构建网格LSTM网络、选择超参数以及生成误差数据集。此外，将误差数据集进一步划分为误差训练集和误差测试集。我们使用误差训练集来优化和构建支持向量机（SVM）模型，并选择合适的超参数。之后，将误差测试集输入到训练好的支持向量机（SVM）模型中，即可得到分类结果，并将该分类方法应用于数据驱动的物联网场景。

从图2可以看出，需要注意的是，与我们早期的解决方案[18]不同，本文提出的EdgeLSTM模型采用了二维网格LSTM，这是长短期记忆网络的一种泛化形式。将单元格连接到网格结构，以实现深度和序列处理。因此，EdgeLSTM能够更有效地提取时间序列数据的多维特征。此外，EdgeLSTM模型还采用多类SVM模型来实现多分类。因此，在异常检测方面，EdgeLSTM模型的准确率始终优于其他竞争模型。相比之下，我们早期的工作[18]提出了将堆叠LSTM模型与朴素贝叶斯方法相结合用于数据预测，其准确率不如EdgeLSTM模型，这一点将在第五节中通过实验加以证明。

IV. 设计原则与实现

网格LSTM单元的内部结构

一个 N维的网格LSTM单元接收来自 N个隐藏向量h1,···, hN以及 N个记忆向量 m1,···, mN作为输入，并输出 N个隐藏向量 h′ 1,···, h′ N和 N个记忆向量m′ 1,···, m′ N，它们均不相同。

网格LSTM单元的计算过程如下：首先，将来自 N个维度的输入隐藏向量拼接为H=[h1,···,hN]T。

我们使用函数形式的长短期记忆网络(·,·,·)作为公式1的简写。该单元计算 N个变换，每个维度一个，从而得到所需的输出隐藏状态和记忆向量：

$$
(h’_1, m’_1) = LSTM(H, m_1, W_1) \
… \
(h’_N, m’_N) = LSTM(H, m_N, W_N)
$$

其中Wi拼接了四个权重矩阵W u i、W f i 、W o i和W c i。u代表输入门，f代表遗忘门，o代表输出门，c代表记忆单元。每个变换都有不同的Wi in R d×2d，并在相应维度上应用标准LSTM机制。N维单元可以排列成 N维网格，形成一个网格LSTM网络。对于一个单元，该网格有N个边带有输入隐藏和记忆向量，以及 N个边带有输出隐藏和记忆向量。一个数据点通过沿其中一个边的一对输入隐藏和记忆向量被投影到网格LSTM网络中。

在EdgeLSTM系统中，我们使用二维网格LSTM单元，其中 N= 2，其内部结构如图2所示。h1和 h2分别表示时间（水平）维度和深度（垂直）维度中的隐藏向量。m1和 m2分别表示时间维度和深度维度的记忆向量。因此，我们在时间维度上使用 h1和 m1进行二维网格LSTM单元的计算，并得到输出隐藏向量h′ 1 和输出记忆向量 m′ 1 。相应地，在深度维度上 h 2和 m 2生成输出隐藏向量 h′ 2 和输出记忆向量 m′ 2 。如图2所示， h 1和 h 2生成公式2中使用的各种门，而 m 1和 m 2结合在一起，用于维持长期且深层的记忆，以学习物联网时间序列数据的复杂特征。

使用网格LSTM网络

构建二维网格LSTM单元后，我们将这些单元连接起来形成一个二维网格LSTM网络，以分析短期和长期时间依赖性。如图2所示，这是一个由四个单元通过循环连接完全连接而成的网格LSTM网络，其中横轴表示时间维度，垂直轴表示深度维度。网络中较低隐藏层的每个单元通过前馈连接在时间和深度维度上与较高隐藏层中的单元相连。训练网络时仅需要当前状态和部分先前状态。

具体而言，时间维度上的输入对应一个时间序列，每个隐藏层的单元对应时间序列中的一个时间步。对于当前时间步的输出，会考虑来自不同时间步的数据，并评估其在下一步时间的影响。对于每个网格LSTM单元，通过第二节中介绍的门控机制来控制数据的输入、存储和输出。当前单元的门控单元接收前一隐藏层在前一时间步生成的输出（例如 mt−1 1 ）以及当前时间步样本的输入，然后确定当前隐藏层的输出（例如mt 1），该输出将在下一步时间用于生成下一隐藏层的输出（例如m t+1 1）。至于沿垂直维度的深度信息处理，其工作流程与时间维度类似；当前单元的门控单元处理来自前一隐藏层的时间序列（例如 m l−1 2 ），并生成当前隐藏层的输出（例如 ml 2）；下一隐藏层的输出（例如m l+1 2 ）相应地被推导出来。

请注意，在EdgeLSTM中，我们将网格LSTM单元在时间维度上的处理输出作为深度维度的输入，然后将网格LSTM单元在深度维度上计算出的输出作为时间维度的输入。通过这种交替过程，时间序列数据在时间维度和深度维度上的影响最终将被建模并整合为跨越所有时间步的预测值，从而实现对短期和长期时间依赖性的分析。因此，网格LSTM结构可以在我们的EdgeLSTM中得到良好扩展，以增强模型从物联网数据中学习更复杂特征的能力。

与单一LSTM网络相比的数据。具体而言，这种改进的网格LSTM网络能够处理在各种实际应用中具有多维特征的物联网传感器数据中的时间序列，而这一点在现有的网格LSTM研究（如[14]）中并未被提及或作为主要关注点。

数据处理

在时间序列数据处理中，我们首先使用下采样技术从原始时间序列数据中获取子序列数据的特征。下采样减少了原始时间序列数据中不必要的特征数量，从而可以加快学习模型的训练速度。具体而言，EdgeLSTM中的下采样主要针对相对高频率的样本，并通过滑动窗口机制进行操作。一个确定大小的窗口在原始样本中移动，窗口内样本的平均值被用来实现下采样的效果。

同时，为了加速模型的收敛速度，EdgeLSTM对采样后的时间序列数据执行最小‐最大操作以进行归一化。最小‐最大归一化是一种线性变换操作，用于标准化原始数据的特征列。我们使用变换函数 $x_{std} = \frac{x - min}{max - min}$，其中 min 和 max 分别是一列中的最小值和最大值。xstd 是线性变换后的标准值，将被映射到区间 [0, 1] 内。

划分数据集、训练模型并获取误差数据集

我们将数据集划分为包含正常数据的训练集、包含正常数据的验证集、包含正常数据的测试集以及包含异常数据的测试集。由于在真实物联网时间序列中异常样本的数量相对较少，EdgeLSTM在预测过程中仅使用训练集来优化和构建网格LSTM模型，其超参数由验证集确定，以实现更优的预测性能。同时，我们将包含正常数据的测试集以及包含异常数据的测试集用于后续分析。

将正常数据和包含异常数据的测试集输入到训练好的网格LSTM模型中，分别获得正常数据和异常数据的预测结果，以评估训练好的模型。然后，可以计算实际数据与预测数据之间的绝对差值，并构建包含正常数据和异常数据误差的误差数据集。

利用误差数据集

在从EdgeLSTM系统的预测阶段获得误差数据集后，我们将误差数据集划分为误差训练集和误差测试集，并将其转换为数值型数据。在误差训练集中采用标注技术对数据进行分类标记。EdgeLSTM将使用具有不同标签值的误差训练集构建支持向量机（SVM）模型，并通过合适的超参数对其进行优化，以得到一个训练良好的支持向量机（SVM）模型。随后将误差测试集输入到该训练模型中，生成分类结果。

现实世界中的物联网应用通常需要解决多分类问题，以将物联网数据分类到不同的类别中。例如，在物联网中，硬件、软件或传输错误可能会导致多种类型的异常。因此，EdgeLSTM采用多分类SVM方法[17]，将单一的多分类问题分解为多个二分类问题。具体而言，多类SVM首先根据误差训练集中标签类型的数量构建若干个二分类器。也就是说，如果有 k种标签类型，则会有k(k−1)/2个二分类器。之后，通过最大胜出投票策略进行多分类，其中每个二分类器将误差测试集中的数据分配到其两个类别之一，然后该被分配类别的投票数增加一票。最终，所有二分类器中得票最多的类别决定数据的分类结果。

EdgeLSTM算法及其应用

如图2所示，作为统一系统处理和分析物联网时间序列数据的EdgeLSTM关键阶段在算法 1中进行了描述。在数据处理后给定 q个样本，每个样本为一条时间序列数据（x1,···, xt,···, xT），其中 t表示序列中的时间步， T为序列长度。网格LSTM单元可以处理这些输入样本，并在时间和深度维度上推导出相应的记忆和隐藏向量，然后将其输出传递到下一步时间用于预测。经过网格LSTM网络中所有时间步的处理后，EdgeLSTM生成目标 y的假设ˆy 作为预测结果。我们使用最小二乘损失函数

$$
loss(\hat{y}) = \frac{1}{n}\sum_{i=1}^{q} |y^{(i)} - \hat{y}^{(i)}|^2
$$

作为网格LSTM模型的代价函数，其中 y (i)代表第 i个样本的预测结果。随后，我们使用通过时间的反向传播（BPTT）算法来训练模型。算法1还描述了EdgeLSTM中多类SVM的使用，用于处理其预测模型生成的误差数据集，并应用于异常检测。

算法1 EdgeLSTM算法及其在异常检测中的应用

输入：训练集 Dtra，验证集 Dval和测试集Dtes ∈ Rm×n，真实值 Vt
输出：异常样本类别

1: for sample (x(i), y(i)) in Dtra do
2: 训练并优化网格LSTM模型
3: end for
4: for sample (x(i), y(i)) in Dval do
5: 为网格LSTM模型选择超参数
6: end for
7: for sample (x(i), y(i)) in Dtes do
8: 测试已训练的网格LSTM模型
9: for feature x(i) j in x(i) do
10: 使用网格LSTM单元在时间和深度维度上进行处理，并从隐藏向量 h′和内存向量 m′返回输出：
11: h′, m′ ← LSTM (H, m, W)
12: 使用 Dtes通过已训练的网格LSTM模型获得预测值 Vp：
13: Vp ← Grid LSTM (Dtes)
14: 使用 Vp和 Vt之间的误差构建误差数据集 E，然后将 E划分为误差训练集 Etra和误差测试集 Etes：
15: E ← Vp − Vt
16: end for
17: end for
18: 在 Etra, Etes中进行标注
19: for each sample in Etra do
20: 训练并优化多类SVM模型
21: end for
22: for each sample in Etes do
23: 使用已训练的多类SVM模型检测异常，并通过最大胜出投票策略对异常进行分类
24: end for

V. 性能评估

为了验证我们的EdgeLSTM系统在边缘处理和分析物联网时间序列数据过程中的可行性和有效性，我们展示了其在几种典型的物联网计算场景：数据预测、异常检测、网络维护和移动性管理，并进行了广泛的性能评估。

我们的边缘节点配置为：GPU：NVIDIA GTX 1050 Ti，CPU：Intel Core i5‐8300H 2.30GHz，内存：8GB DDR4，使用谷歌深度学习平台TensorFlow实现EdgeLSTM模型和算法，并利用GPU加速模型的训练过程。我们进行了一系列实验，将EdgeLSTM与堆叠LSTM [19] 和多层感知机（MLP）[20] 进行比较。对于EdgeLSTM的网格LSTM模型，我们使用一个输入层、五层LSTM和一个分类层来构建该模型。对于堆叠LSTM模型，它是另一种通过将LSTM层逐层堆叠以增加容量的LSTM网络结构，我们使用一个输入层、两个带有LSTM记忆块的隐藏层、两个全连接层以及一个分类层来构建该模型。对于MLP模型，它是一种由输入层、多个隐层和分类层构成的传统神经网络模型，其中我们使用了三层隐层。

A. 数据预测

1) 数据集描述

我们使用三个时间序列数据集：电力数据 [23]、环形传感器数据 [24] 和气候温度数据 [25]，以评估数据预测的性能。由于某些时间序列数据具有周期性，而另一些则不规则，表I显示了每个数据集在不同延迟情况下的自相关系数（ACF）[26]。我们采用值为 k 的延迟来计算当前时间步与过去 k 时间步之间的系数，以评估这些数据集的短期和长期时间依赖性。因此，自相关系数（ACF）可定量描述过去事件与当前事件之间的关系。如表I所示，当延迟为10时，电力数据集的自相关系数（ACF）为‐0.33；这表明电力数据集具有长期时间依赖性。同时，当延迟为5时，环路传感器数据集的自相关系数（ACF）小于0.1，当延迟为10时，气候温度数据集的自相关系数（ACF）小于0.2；这表明这两个数据集具有短期时间依赖性。

电力数据集 。我们查询了一个公开的数据集，该数据集记录了荷兰一家研究机构一年内的电力需求情况[23]。数据每天以每15分钟一次的频率进行采集。我们对原始电力数据按每周进行降采样，得到的数据构成模型的输入样本。正常情况下，工作日的前5天电力消耗相对较高，而在周末则相对较低。图3(a)分别对比了EdgeLSTM和 LSTM‐Gauss‐NBayes的预测值（绿色曲线）与采集的真实值（红色曲线）。需要注意的是，用户的电力数据通常含有噪声，因此不同日期的峰值并不会完全在同一时刻出现。可以看出，两个模型均能预测出用电量的总体趋势，即前5天有5个峰值，随后两天存在一定谷值。然而，EdgeLSTM表现出在峰值和谷值附近的区域，准确率甚至高于 LSTM‐Gauss‐NBayes。例如，当时间为25小时左右时，LSTM‐Gauss‐NBayes的预测值与其真实值之间存在较小的差距，而EdgeLSTM的预测值则与真实值高度一致。对于其余的峰值和谷值也出现了类似情况。其原因是EdgeLSTM将长短期记忆网络单元推广到网格结构，以实现深度和序列处理，能够比仅学习物联网时间序列数据单一特征的LSTM‐Gauss‐NBayes更有效地提取电力数据的多维特征。如果一个样本在一周的前五天出现谷值，或两天后出现波峰，则可能属于异常，因为它明显违背了用户用电量的正常趋势。

环形传感器数据集 。该数据集采集自体育场附近路面安装的环形传感器，由加州大学欧文分校（UCI）[24] 发布。它描述了经过体育场附近的车辆数量。该数据集仅在体育场有比赛时进行采集。从表I可以看出，当延迟为5时，其自相关系数为0.01，因此该数据集具有短期时间依赖性。为了更好地分析和使用该数据，我们对原始时间序列进行了筛选，仅选取比赛前1小时和比赛后2小时的数据。图3(b)展示了两种模型（EdgeLSTM和 LSTM‐Gauss‐NBayes）的实际采集值及其预测值的对比示意图。总体来看，我们可以看到两种方法都能捕捉到时间序列的总体特征。在8th小时左右出现一个峰值，随后是一个小谷值，并在到达16th小时左右的另一个峰值之前出现一些波动，最后呈现适度下降。EdgeLSTM的准确率始终高于LSTM‐Gauss‐NBayes，尤其是在两个峰值之间的波动阶段（从8th小时到16th小时）。例如，在10th小时左右，EdgeLSTM能够很好地捕捉到小波谷的位置，而LSTM‐Gauss‐NBayes则表现出较大误差。这归因于我们在EdgeLSTM中有效利用了网格网络结构，能够捕捉具有短期时间依赖性的时间序列数据的多维特征。

气候温度数据集 。这是2009年至2016年期间在德国耶拿的马克斯·普朗克研究所气象站记录的气候温度数据集。我们提取了该温度数据集中每小时采样一次、持续一天的数据子集，生成输入样本。如表I所示，该数据集具有短时间依赖性。在最初5小时内，每日温度在午夜时段出现急剧下降趋势，并于凌晨5点左右达到谷值。随后在早晨开始呈现上升趋势，并在下午3点左右达到峰值，之后在傍晚时段呈现适度下降趋势。在上午7‐10点期间，温度上升速率出现一些小幅波动，这可能是由于受到自然阳光和天气变化等外部因素影响所致。如图3(c)所示，随着时间的推移，两个模型（EdgeLSTM和LSTM‐Gauss‐NBayes）的预测温度与实际值分别通过相关曲线进行可视化对比。从结果可以看出，尽管两个模型均能较好地捕捉温度变化的整体趋势，但EdgeLSTM表现更优。LSTM‐Gauss‐NBayes在谷值附近（大约上午5‐10点）的表现较差。这是因为EdgeLSTM使用了二维网格LSTM单元，能够有效捕捉二维信息（时间和深度），从而更准确地提取气候温度数据中谷值的不同特征。相比之下，LSTM‐Gauss‐NBayes模型的隐藏层中没有深度维度，无法准确捕捉气候温度数据随时间变化的多方面特性。

2) 数据预测评估

我们采用两个指标，即平均绝对百分比误差（MAPE）和R2分数，来衡量三种模型（EdgeLSTM、堆叠LSTM和多层感知机（MLP））在三个数据集上的预测性能，其性能结果如图4所示。

评估指标 。MAPE是实际值除以平均绝对误差，消除了数据维度的影响。它表示相对误差，可以衡量模型预测值与真实值之间的差异。MAPE值越小，预测性能越好。其公式为：
$$
MAPE = \frac{1}{n}\sum_{i=1}^{n} \frac{|y_i - \hat{y}_i|}{y_i}
$$
其中 $y_i$ 是第 $i$ 个时间步数据的真实值，$\hat{y}_i$ 是第 $i$ 个时间步数据的预测值，$n$ 是样本总数。

R²分数，即决定系数，可用于确定模型对未知数据的拟合程度，并衡量模型对未来样本的预测能力。最佳分数值为1.0，也可能出现负值。其公式为：
$$
R^2 = 1 - \frac{\sum_{i}(y_i - \hat{y} i)^2}{\sum {i}(y_i - \bar{y})^2}
$$
其中 $\bar{y}$ 为样本的平均值，其他符号的含义与MAPE中的定义相同。

Choices of Sliding Window Size 。为了研究滑动窗口大小如何影响预测的准确率，我们在一周的电力数据集上将滑动窗口的大小从1小时变化到2小时，并比较不同滑动窗口大小下的预测准确率。由于趋势相似，我们仅报告电力数据集上的定性结果（如图5所示），并省略其他数据集上的类似结果。可以看出，在电力数据集上，当滑动窗口大小设置为1小时时，MAPE值为较低值；当窗口大小增加到2小时时，MAPE值变得相当高（4.176），此时电力特征的五个谷值和峰值未能被很好地捕捉，如图5(b)所示。因此，较大的滑动窗口设置会导致预测准确率下降。因此，在接下来的实验中，我们将滑动窗口大小设置为1小时。

结果与分析 。图4(a)展示了三种模型（EdgeLSTM、堆叠LSTM和MLP模型）在三个真实数据集上评估的MAPE值。从结果可以看出，所有模型在具有长期时间依赖性的电力数据集上均表现出较好的性能。特别是，EdgeLSTM的MAPE值分别优于堆叠LSTM和MLP模型，突显了我们所提出的网格网络结构在学习物联网时间序列数据多维特征方面的有效性。由于电力数据集仅包含一个特征值（即功率值），EdgeLSTM模型在预测复杂数据方面的优势未能在该数据集上充分体现，其性能相较于其他模型并无显著提升。相反，MLP模型的MAPE值始终明显劣于其他两个模型。因此，MLP模型不适用于具有长期依赖性的时间序列数据预测。

在具有短期时间依赖性的气候数据集上，EdgeLSTM相较于堆叠LSTM和多层感知机（MLP）的优势更为明显，因为EdgeLSTM与其他两个模型之间的MAPE差距远小于在电力数据集上的差距。原因是EdgeLSTM利用了能够有效捕获高维信息（包括时间和深度）的网格LSTM单元，从而在气候温度预测中表现出更高的准确率。相比之下，堆叠LSTM和MLP模型由于无法捕捉上午7‐10点期间由外部因素（如自然阳光和天气变化）引起的小幅波动及其上升速率（如图3(b)所示），其MAPE值最低。对于环路传感器数据集，由于其同样具有短期时间依赖性和多特征，EdgeLSTM模型在预测性能上远优于其他两种模型。

图4(b)比较了 R²的值。MLP和堆叠LSTM的 R²值分别低于EdgeLSTM，表明EdgeLSTM在预测具有长期时间依赖性的时间序列数据方面具有更强的能力。在环路传感器数据集上，由于EdgeLSTM在时间维度和深度维度上的预测能力均最佳，其表现再次优于其他两个模型。对于气候数据集，可以看出EdgeLSTM表现最好，其R²值接近1。相比之下，堆叠LSTM的 R²值仅为0.849，在三个模型中最低，因为它未能捕捉多维特征以处理复杂时间序列。

B. 异常检测

1) 二分类评估

为了全面分析EdgeLSTM在具有不同短期和长期时间依赖性的数据集上的异常检测表现，我们首先将EdgeLSTM模型与原始版本的网格LSTM模型、堆叠LSTM模型以及MLP模型进行比较，使用上述三类数据集（电力、环路传感器和陆地传感器）。由于这些数据集并非由我们直接采集，我们无法获得其具体异常类型的详细信息，也无法根据异常类型对训练数据进行标注。然而，我们仍可通过预测值与采集的真实值之间的差异分析，利用二分类方法检测数据中是否发生了异常。

评估指标 。我们使用四个指标：准确率、精确率、召回率和F1，来全面评估我们的模型，并将其与其他三个模型进行比较。这些指标已被广泛用于评估机器学习算法 [27]。各指标的详细信息如下：

$$
Accuracy = \frac{TP + TN}{TP + FN + FP + TN}
$$

$$
Precision = \frac{TP}{TP + FP}
$$

$$
Recall = \frac{TP}{TP + FN}
$$

$$
F1 = \frac{2 \cdot Precision \cdot Recall}{Precision + Recall}
$$

其中，TP、FP、TN 和 FN 是分类的四种结果，分别表示真正例、假正例、真负例和假负例。

一般来说，准确率主要用于表示模型在测试数据集中正确分类的样本数量占总样本数量的比例。由于我们的目标是识别样本是否为异常，因此精确率和召回率也是评估我们模型的重要指标。精确率通常用于判断分类器能否正确识别异常，召回率主要用于评估分类器能否识别出所有异常样本。F1 score 是精确率和召回率的综合指标，能够全面反映模型的性能。

结果与分析 。表II显示了每个模型在三个数据集的四项分类指标下的性能。我们对每个数据集各项指标的最高值进行了加粗强调。

对于电力数据集，它是一个在时间上具有长期依赖性的数据集。从表II可以看出，根据各项指标的结果，具有LSTM单元多维结构的模型通常优于LSTM的普通隐藏层。同时，该数据集具有一定的周期性，例如用电量在前5天较高，之后2天较低。这种周期性行为是时间序列数据中一个非常重要的特征。因此，利用这一特征很容易构建出良好的时间序列模型。我们可以观察到MLP模型的表现也很好，其F1 score达到了91.1 percent。

对于环路传感器数据集，它也与时间顺序密切相关。然而，与电力数据集相比，该数据集的特征较为模糊，因此难以区分其异常和正常的时间序列。如表II所示，堆叠LSTM和MLP模型在该数据集上的实验结果不理想。特别是，MLP模型的异常检测精确率仅为80.4%。相比之下，EdgeLSTM模型和LSTM‐高斯‐朴素贝叶斯模型由于其网络能够通过计算误差来处理复杂数据，在该数据集上优于其他模型。

对于气候传感器数据集，它具有短期时间依赖性。从表II中的 F1 得分可以看出，LSTM‐高斯‐朴素贝叶斯模型和堆叠LSTM模型对该数据集的异常检测效果均较差。因为在早上5点到10点期间，数据集的特征不明显，且其上升速率处于频繁波动的范围内。相比之下，EdgeLSTM在所有准确率指标中表现出最佳性能，显示出其在捕捉具有短期时间依赖性的时间序列数据的多维特征方面的优越性。

从表II可以看出，本文提出的EdgeLSTM模型在二分类任务中检测异常存在性方面表现出最佳性能。由于我们在网格LSTM网络中的数据处理、信息传播和模型训练方面的特定设计，该模型也优于LSTM‐高斯‐朴素贝叶斯模型。

2) 多分类评估

我们为EdgeLSTM系统专门设计的多类SVM能够实现多分类。为了评估其在现实场景中检测特定且多种类别异常的性能，我们需要基于历史数据学习经验收集包含已知异常模式的数据集。然后，通过对这些类别的异常进行标注来构建相应的误差数据集，用于训练多类SVM，并在其他时间序列数据上进行测试。

我们通过从FIT物联网实验室测试平台提供的里尔站点中选取6个传感器节点（M3开放节点）收集光照数据，实现了这一目标[28]，如图6 (a)所示。为了获得光照强度变化明显的时间序列数据，我们选择的6个传感器节点靠近窗户。每个节点均配备ARM Cortex M3微控制器、64 kB内存、IEEE 802.15.4射频 AT86RF231以及可充电3.7V锂聚合物电池。我们在测试平台中生成了多个随机异常，并收集了一个月的光照数据轨迹，共包含43,200条数据记录（每15分钟4条记录，每天约1,440条记录）；该轻量数据集可供公众访问[29]。

实验中考虑了三种类型的异常，即攻击异常、网络异常和硬件异常。为了在我们收集的时间序列数据中检测这些异常，EdgeLSTM在误差训练集中为三种异常类别标注不同的值，以训练一个多类SVM模型。然后，将误差测试集分别输入训练模型中，以区分三类异常中的每一对，并采用最大胜出投票策略对异常数据进行分类。

评估指标 。我们引入另外两个指标：受试者工作特征（ROC）和曲线下面积（AUC），以进一步评估EdgeLSTM分类模型的鲁棒性和可靠性。ROC曲线由三个部分组成：真正率（TPR）、假正率（FPR）和分类阈值，其中
$$
TPR = \frac{TP}{TP + FN}, \quad FPR = \frac{FP}{FP + TN}
$$
通过调整分类阈值，分类器获得不同的真阳性与假阳性组合对。TPR和FPR值构成了ROC数据点，用于直观反映分类模型的性能。AUC是ROC曲线下的面积，AUC值越接近1，分类模型的性能越好。

结果与分析 。图6 (b)评估了我们的EdgeLSTM模型的分类性能，并通过轻量数据集上的ROC分析和AUC值将其与LSTM‐高斯‐朴素贝叶斯模型、堆叠LSTM模型以及MLP模型进行比较。我们观察到EdgeLSTM表现最佳，因为其ROC曲线下的面积在所有模型中最大。其优越性能也体现在AUC值达到0.943上。根据ROC曲线的定义，我们可以看到ROC持续降低分类阈值，然后计算TPR和FPR的值。通过分析EdgeLSTM模型的ROC曲线，我们发现随着阈值不断降低，TPR值迅速达到0.9。这表明我们的方法比其他方法更稳健可靠。尽管其余三个模型的表现并不差，但它们的ROC曲线变化不如我们的稳定，且TPR值的增长速率仍略逊于我们的模型。

我们进一步使用多类SVM评估EdgeLSTM，以在轻量数据集中实现对攻击、网络和硬件异常的多分类。考虑到EdgeLSTM中的多类SVM需要在异常检测过程中处理由Grid LSTM预测模型生成的误差数据集，我们首先评估了无异常的正常光照数据的预测性能。如图7 (a)所示，在较长的测试时间内，光照强度的预测值能够很好地匹配测试平台中采集的真实值，验证了EdgeLSTM在多分类任务中的预测有效性。

对于具有多种类别的异常检测，我们在预测阶段后使用包含异常数据的轻量数据集构建误差数据集。然后将误差数据集划分为包含离群值的误差训练集和误差测试集。误差训练集用于训练我们的多类SVM模型，随后误差测试集可用于检测异常并通过训练模型指定其类别，如图7 (b)、(c)和(d)所示。

具体而言，攻击异常是由恶意攻击引起的，攻击者可能知道某些时刻的光照强度，并故意操纵其值。然而，攻击者并不了解下一阶段的光照情况，因此可能导致预测值与真实值之间出现较大偏差，如图7 (b)中所检测到的。此处的网络异常指的是测试平台中的网络传输故障，特别是多跳无线传输中的故障。当在某一时间点未接收到数据时，根据我们的设置，光强值会突然降至0，即为网络异常，如图7 (c)所示。硬件异常是由于硬件故障引起的。根据我们的实验经验，当光强值曲线原本遵循某种模式，但在若干时间步后模式发生变化或变得不规则，则主要由硬件异常引起。图7 (d)展示了对此类异常的检测结果。

C. 网络维护

随着新兴物联网应用对低延迟甚至实时特性的需求不断增加，EdgeLSTM系统预计将在网络边缘部署，并具备在物联网时间序列数据源头附近进行处理和分析的能力。

由于目前缺乏提供可访问且可编程的边缘计算辅助物联网平台的开放测试平台，我们自行搭建了这样一个测试平台，用于评估EdgeLSTM在网络维护方面的性能，如图8 (a) 所示。我们使用12个传感器节点构建一个无线网状网络，以在会议室环境中收集室内光照数据，该环境中的照明通常会根据预定的会议行为自动开关，数据通过多跳无线通信传输到附近的边缘节点。一个汇聚节点直接连接到该边缘节点，并将采集的数据传送给它。这些传感器节点是商用现成设备，每台平均价格约为10美元，配置包括 CC2530‐F256 2.4 GHz射频收发器、高性能低功耗8051微控制器、256 KB片内可编程闪存、8 KB带保持功能的RAM等。每个传感器节点在无额外增益天线情况下的传输范围约为0.3米。三种类型的NVIDIA GPU平台被用作经济型边缘节点，分别是GTX 1050 Ti、GTX 1080 Ti和 GTX TITAN Xp，以在边缘辅助物联网计算中实现综合评估。

1) 协议工程

我们在边缘进行网络维护的场景是使用部署在边缘节点上的EdgeLSTM来检测远程源节点收集的时间序列光照数据中的异常。如果检测到数据篡改或污染，边缘节点将通过端到端可编程方式强制源节点将其数据传输路径切换到新路径。如图8 (a)所示，标记为圆形的源节点用于传输光照数据的旧多跳路径（红色）随后更改为蓝色的新路径。新的多跳数据传输路径可以通过协调的数据包追溯方法找到，其中网络内处理将数据包记录在分布在相邻监听传感器中的多维Bloom过滤器[30]中，并随后检索信息。在该方法中，每个节点使用 k 维护一个布隆过滤器哈希函数，每个转发传感器将其感兴趣的类别数据包记录在其布隆过滤器中。节点将包含数据包ID、本地节点ID、接收者ID和源节点ID的拼接字符串哈希为表索引，并在布隆过滤器中将相应位设置为1。通过这种方式，它可以通过转发节点与侦听节点之间的一系列控制消息交换来识别数据包的传输路径。

具体而言，如图8(b)所示，当边缘节点因检测到异常而对数据包发起回溯查询时，它将指定位于异常区域附近的汇聚节点通过广播发送包含源节点ID和检测到的数据包ID的追踪数据包。由于无线广播的特性，传感器6、7、8和9接收到该追踪数据包。它们将提取检测到的数据包ID、本地节点ID、发送者ID、源节点ID，并运行哈希函数。如果传感器6中出现正命中，表示其属于旧路径，则传感器6会向汇聚节点发送确认数据包以进行源路由构建。此外，传感器6根据其当前邻居生成进一步的回溯数据包，并向传感器3、5和7发出新的请求。之后，追踪数据包的生成过程与上述相同，直到某节点的ID等于从追踪数据包中提取出的源节点ID，e.g.传感器1。由于旧路径中的任何转发传感器都可能是攻击者或异常节点，源节点随后会启动新路径的建立，以避免经过这些可疑节点。我们在运行Contiki 2.7版本操作系统的传感器节点上实现了该方法，由于使用了布隆过滤器，该方法仅需在传感器上占用较小的内存占用，并允许传感器异步刷新布隆过滤器，从而持续监控网络流量，并在边缘节点检测到异常时重新建立新路径以实现可靠数据传输。

2) 网络维护评估

为了在边缘节点对EdgeLSTM进行数据处理和分析，我们使用了一个月室内光照数据集，其中每天收集约1,000条数据记录。图8(c)中的热力图显示了我们所用光照数据之间的时间相关性。横纵坐标表示一个月中的某一天。每个网格描述了对应两天在同一时间段内的数据相关程度，其中绿色越深表示相关性越高。总体而言，结果表明EdgeLSTM确实捕捉到了历史轨迹中的规律性和周期性，因此可以从该数据集中生成一个训练良好的模型，并部署在边缘节点用于网络维护。

上述网络维护场景中的关键性能指标，即通过重新建立的路径在边缘节点检测异常并收集数据的平均延迟，已在我们的测试平台中进行了评估，并在图8(d)中展示。我们比较了三种不同类型的边缘节点辅助下的物联网计算性能。在从数据集中获得训练好的EdgeLSTM模型后，我们将其部署在边缘节点上，用于检测物联网网状网络中的异常；我们采用网状网络是因为它能够在有限数量的传感器节点下提供更多的路径选择。实验结果表明，配置NVIDIA GTX TITAN Xp的边缘节点进行异常检测所用的平均时间为2.82秒，其次是GTX 1080 Ti耗时5.76秒，GTX 1050 Ti耗时16.74秒。相应的置信区间也在图8(d)中给出。该性能合理反映了各硬件在处理深度学习网络方面的能力。从异常检测到源节点切换新的数据传输路径后，在边缘节点完成可靠数据收集的总时间成本也在图8(d)中呈现。其中，使用三款GPU中成本最低的GTX 1050 Ti配置的边缘节点，其平均延迟最长为18.04秒，这表明我们的EdgeLSTM能够满足网络维护场景对低延迟的需求，从而为网络边缘的物联网计算提供了一种可行且有效的解决方案。

D. 移动性管理

网络资源访问控制是无线互联网服务提供商的首要任务之一，需要适当的管理架构[31]。在物联网应用中，有效的边缘计算也有助于协调和优化移动接入控制。软件定义网络（SDN）[32],[33]是一种相对较新的通信网络范式，它将控制平面与数据平面分离，其中控制由SDN控制器处理，因此为监控和管理移动边缘计算提供了一个可行的解决方案。随着移动物联网部署规模的不断扩大，有必要将SDN推向网络边缘，并构建分布式控制平面以管理物联网设备的移动接入[34]–[36]。

我们进一步扩展了图8 (a)中所示的边缘计算测试平台配置，并实现了如图9(a)所示的软件定义边缘计算原型，以支持EdgeLSTM中的物联网移动性管理。边缘节点采用基于Java的Floodlight控制器版本1.2[37]，用于在多个控制器之间提供数据流信息的分布式存储、修改、副本和迁移。思科 Linksys WRT1900AC WiFi路由器被选作OpenFlow交换机，其内置OpenWrt系统并支持自定义固件。我们使用Open vSwitch（OVS）[39]，并对WRT1900AC的固件进行重新编译，以支持OpenFlow协议。然后WiFi接口可以添加到OVS网桥中，以便在移动场景下为物联网设备提供无线接入。

1) 协议工程

如图9(b)所示，在EdgeLSTM中的软件定义边缘计算中，多个部署在网络边缘附近的控制器将网络划分为若干个分区，这些分区代表不同的地理区域。单个分区内的所有物联网移动设备（MDs）在网络边缘与其接入点（APs）关联，并连接到本地OpenFlow交换机，以从相应的数据服务器请求各种类型的数据流。与服务请求和流传输相关的信息可由安装在边缘节点中的分区依赖控制器进行分析和管理。在移动物联网场景中，物联网设备在不同时段在不同分区间移动。新加入或离开的物联网设备可在本地控制器中记录，因此每个控制器都拥有其本地网络状态的分区视图。在EdgeLSTM中，来自不同分区的交换机相互连接，从而可以通过这些互联的交换机交换不同控制器中记录的网络信息，实现网络一致性与移动性管理。

边缘节点上维护的物联网设备网络信息既包含时间特征（例如：预定事件、传输日志），也包含空间特征（例如：地理位置、流类型）。EdgeLSTM通过在其网格LSTM结构中探索深度维度，将顺序计算扩展到时空计算，从而捕捉超越时间轨迹的多维特征，以支持移动物联网场景中的移动性管理。为实现这一目标，EdgeLSTM引入了Soft AP协议，确保物联网设备在不同地理区域间接入点之间的无缝切换，并促进设备时空上下文的可扩展控制与传输。运行在EdgeLSTM控制器中的Soft AP协议，在每对移动设备与接入点之间复制完整的关联参数，并在目标接入点重新建立将与该移动设备连接的关联参数。这些关联参数包括状态信息，如移动设备MAC地址、接入点MAC地址、数据帧序列号、移动设备关联ID、流状态等。通过这种方式，移动设备会将新连接的接入点视为原来的接入点，完全感知不到控制器中正在进行的移动性管理操作。

具体而言，当当前MD‐AP关联的信号强度下降到某一水平以下时，EdgeLSTM控制器通过序列计算检测到这种情况，并启动Soft AP协议执行切换操作，其中控制器将上下文信息从旧接入点传输到新接入点。一旦移动上下文信息完成传输，Soft AP通过新接入点广播一个以移动设备的MAC地址为源地址的伪数据帧，更新控制器交换表中的二层路由信息。图9(b)展示了使用Soft AP协议的移动性管理场景，其中分区1和分区2分别由控制器1和控制器2管理。一个物联网移动设备MD最初位于分区1并与接入点AP1关联。当MD移出AP1附近区域时，控制器1检测到信号质量变化，并利用网格LSTM对时间序列数据进行学习，预测其地理位置目的地（分区2）。然后，在MD进入分区2之前，控制器1可通过分区1与分区2之间交换机的连接，将MD − AP1关联上下文迁移到控制器2。相应地，控制器2选择AP3来连接MD，使得AP3在其移动过程中对节点MD表现为AP1，这些接入点轮流为MD转发数据流。通过这些操作，EdgeLSTM能够保持MAC层管理信息的完整性，避免重新建立移动设备与网络后端之间的关联状态，从而满足边缘侧移动物联网的可扩展性需求。

2) 移动性管理评估

我们意识到，物联网设备在网络边缘的真实移动接入模式遵循事件或动机驱动行为。为了更好地在这种移动场景下评估EdgeLSTM，我们收集了一段由课程事件驱动的校园范围移动轨迹，并将其用于评估。具体而言，该轨迹是在教学楼附近两节连续课程之间的一段时间（10分钟）内采集的。在此期间，部分学生在上完课后离开教学楼，部分学生前往教学楼准备上课，还有一些学生仍留在楼内，呈现出具有时间序列特征的规律性行为。我们在该建筑内不同教室中部署了四个相隔一定距离的支持OpenFlow的接入点，使其信号覆盖范围相互独立。两个安装了OpenFlow控制器的边缘节点构建了一个分布式场景，根据移动轨迹文件，在此期间协调来自100多个物联网设备的不同服务请求。

如图9(c)和(d)所示，我们从这些活跃的物联网设备中选择了30个流，这些流对网络吞吐量和延迟有不同的要求，包括5个文件共享流、10个音频流和15个视频流。文件共享流通过发送恒定比特率进行建模，包长度在[100, 1000]字节内均匀分布，固定周期在[0.01、0.1]秒内均匀分布，遵循先前研究中描述的标准设置[40]。音频和视频流来自真实流量轨迹[41],[42]。特别是，此处的视频流采用HTTP自适应流（HAS）范式。我们将EdgeLSTM与FreeSurf [43]和UbiFlow [35]分别提出的两种基于OpenFlow的无线接入控制方案进行比较。FreeSurf切换是软件定义网络在无线环境中的简单实现，没有特定的移动性管理。UbiFlow采用分布式控制器进行流调度，但将移动上下文从旧控制器迁移到新控制器只有当物联网设备移动到新分区并向新控制器发送流请求后，才会发生控制器切换。性能结果显示，在物联网设备与接入点关联以进行连续流传输后，EdgeLSTM在端到端吞吐量和延迟评估方面均优于FreeSurf和UbiFlow。对于30个流，EdgeLSTM可实现平均吞吐量9.13兆比特每秒，而UbiFlow为7.65兆比特每秒，FreeSurf仅为6.36兆比特每秒。EdgeLSTM的平均延迟约为0.68秒，而UbiFlow为1.21秒，FreeSurf为2.13秒。EdgeLSTM和UbiFlow的性能优于FreeSurf，因为这两个系统都在网络边缘采用了分布式流调度和移动性管理方案。此外，EdgeLSTM的性能也优于UbiFlow，原因是当物联网移动设备在相应分区之间漫游时，可通过Soft AP协议在设备连接到新接入点之前完成时空上下文和流信息的转移。因此，当设备进入新分区后，该分区的控制器将为其分配一个新的接入点，并利用先前MD‐AP关联状态的镜像通过轻量级无缝切换继续数据流的传输。因此，其端到端延迟相比UbiFlow和FreeSurf显著降低。此外，考虑到边缘处移动设备的时间序列和空间激活特性，每个控制器都维护一个数据库，用于定期记录其分区内设备的时空信息。借助EdgeLSTM中网格LSTM网络对特征表示和时空依赖关系的深度学习，控制器既可以使用本地历史记录，也可以从其他控制器获取数据，以预测设备的演化趋势，预测结果将由分布式控制器协同用于移动性管理。因此，EdgeLSTM中的端到端吞吐量和延迟可以进一步改善。

总体而言，这些实验验证了EdgeLSTM模型和方法提供了一个统一系统，用于处理和分析具有短期和长期时间依赖性的物联网时间序列数据，并适用于边缘物联网计算中的不同应用场景。

VI. 相关工作

以往的工作均未设计统一的数据驱动网络系统，以充分发挥边缘计算在物联网应用中的潜力。同时，在网络边缘针对具有多维特征的复杂物联网数据进行深度与序列计算的问题也尚未得到充分解决。

1) 数据驱动网络

数据驱动网络是将大数据分析应用于原始网络数据，然后利用结果优化网络性能[44]。其常见的挑战和可复用的设计原则在[5]中进行了讨论。数据驱动评估[45]已被用于LTE网络以理解移动数据模式。移动网络中的上下文信息可以提升基于预测的决策能力。由于移动流量数据具有时间依赖性，大规模蜂窝网络的流量预测已采用时间序列方法[46]。此外，在[11]中提出了一种使用深度神经网络提取移动感知运动数据公共基的无监督学习方法。它还基于多分辨率嵌入发现了人类活动的层次性。至于物联网应用，FarmBeats [6] 最近被设计为一个端到-end的农业物联网平台，利用多种传感器，支持不同的带宽约束，并提供云存储以进行大数据分析。然而，统一的数据驱动型物联网系统尚未在新兴的边缘计算场景中得到充分展示和研究。

2) 经典时间序列方法

传统技术通过检测序列中的连续变化，并利用历史数据来预测趋势的发展，使用诸如在时间窗口内进行累积和（CUSUM）以及指数加权移动平均（EWMA）等统计指标来检测分布的潜在变化。时间窗口的长度通常需要预先确定。一种代表性的时间序列方法模型是自回归移动平均模型（ARIMA）[26]。该ARIMA模型将非平稳时间序列转换为平稳时间序列，并基于时间序列的过去值和当前值预测未来值。然而，其准确率较低，仅适用于短期预测。在时间序列数据处理中曾提出一种简单的前馈神经网络[47]。该方法预定义滑动窗口以构建特征，从而利用时间序列之间的关系，但这种方法对参数依赖过多，可能导致不稳定性。此外，还有一些用于处理序列数据的序列模型，如条件随机场模型[48]、卡尔曼滤波器[49]、马尔可夫模型[50]，但这些模型缺乏学习长期依赖的能力。

3) RNN 和 LSTM 学习

循环神经网络（RNN）[20]理论上可以解决长延迟任务，而无需预定义时间步，但在较长的时间序列任务中容易出现梯度爆炸或梯度消失。这使得学习长期依赖的时间序列变得困难，可能导致不稳定和准确率低。LSTM网络[15]是RNN的一种变体，通过引入特殊的门控机制来控制对记忆单元的访问，从而有效解决梯度消失或梯度爆炸问题。由于门控机制可以防止网络其余部分在多个时间步内修改记忆单元的内容，LSTM网络比普通RNN能更长时间地保留信号并传播误差。然而，单一LSTM网络仅在时间方向上具有记忆能力，因此无法处理复杂特征。堆叠LSTM[19]通过将多个LSTM层叠加在一起以增加容量