计算机视觉研究院 | 面向无人机飞行员识别方案的任务增量学习

本文来源公众号“计算机视觉研究院”,仅用于学术分享,侵权删,干货满满。

原文链接:https://mp.weixin.qq.com/s/rUEK-uRy_2FvmcD9UCdabA

随着无人驾驶航空器(UAV)技术的成熟以及工业物联网的发展,无人机已成为智能交通系统中不可或缺的一部分。由于缺乏有效的识别方案,大多数商用无人机在飞行过程中会遭受身份伪装攻击。一些开创性的研究工作已经尝试在飞行初始阶段和飞行过程中验证飞行员的合法身份。然而,现成的飞行员识别方案由于缺乏可扩展性,无法适应动态的飞行员成员管理。

PART/1     概述   

为应对这一挑战,我们提出了一种基于增量学习的无人机飞行员识别方案,通过利用飞行员的时间操作行为特征来保护无人机免受身份伪装攻击。所提出的识别方案能够验证飞行员的合法身份,并将新注册的飞行员动态适配到构建完善的识别方案中,以实现动态的飞行员成员管理。经过系统性实验,该方案在P450数据集上实现了95.71%的最佳平均识别准确率,在S500数据集上实现了94.23%的最佳平均识别准确率。随着注册飞行员数量的增加,该方案对新增飞行员和之前注册的飞行员仍保持较高的识别性能。由于系统开销极小,该识别方案在保护无人机免受身份伪装攻击方面展现出巨大潜力。

PART/2     背景   

随着工业物联网和5G技术的不断发展,无人机已与软件定义网络、区块链等各类新兴技术深度融合,以提供可靠服务。凭借高机动性和可操作性,无人机在基于软件定义网络(SDN)的无人机通信网络中可作为个体交换机实现流量转发。另一方面,区块链技术也已应用于无人机集群,以保障无人机与飞行员之间交易的安全性、成本效益与隐私性。 

由于无人机已成为智能交通系统中不可或缺的部分,许多攻击者试图为了恶意目的破坏飞行中的无人机。目前,商用无人机中已发现一些漏洞。例如,文献的作者揭示,GPS欺骗攻击可误导飞行中的无人机前往被篡改的目的地。Son等人在文献中也发现,共振效应会放大微机电系统(MEMS)陀螺仪的估计偏差,导致无人机无法进行飞行前检查。此外,基于网络的攻击,如拒绝服务攻击和中间人攻击,也对无人机飞行构成重大威胁。与上述漏洞相比,飞行员身份伪装攻击——攻击者试图伪装成受害飞行员,利用被盗取的凭证向飞行中的无人机发送恶意控制指令——对无人机安全构成了严重威胁。由于攻击者无需生成伪造的无线电信号即可获得无人机控制权限,飞行员身份伪装攻击更难检测,也更难以防范。

目前,已有多项研究工作对飞行员合法身份的验证进行了探究,以保护无人机免受飞行员身份伪装攻击。例如,Zhang等人在文献提出在飞行初始阶段利用单向哈希函数和按位异或(XOR)操作进行身份认证和密钥协商。通过安全工具分析,他们证明了该方案在随机预言机模型下的安全性,能够满足无人机互联网环境的安全要求,以抵御各类攻击。之后,Alladi等人在文献中为无人机-地面控制站(UAV-GCS)提出了一种基于物理不可克隆函数(PUF)的双向认证方案SecAuthUAV。通过与最先进的认证协议对比,作者们验证了其提出的方案能够很好地抵御无人机通信信道上的伪装、重放、节点篡改和克隆攻击。另一方面,许多基于机器学习(ML)的识别方案也被设计用于确保无人机飞行员在飞行过程中的合法身份。例如,shouFan等人在文献中首先通过监控远程无线电控制器发送的指令来验证飞行员的合法身份。在使用线性判别分析(LD)、二次判别分析(QD)、支持向量机(SVM)、加权k近邻(k-NN)和随机森林(RF)对提取的控制指令进行分析后,随机森林算法取得了最佳性能,准确率接近89%。Alkadi等人在文献中进一步结合机载传感器测量数据和接收到的控制指令,以提升无人机飞行员识别性能。通过使用长短期记忆(LSTM)、基于特征和基于多数投票的分类算法进行分析,作者得出结论:这些组合方法可增强飞行员识别性能。由于汽车驾驶员与无人机飞行员操作之间存在相似性,一些已应用于汽车驾驶员的算法,如XGBoost和SVM,在无人机飞行员识别中也能取得出色表现。

尽管在减少无人机飞行员身份伪装攻击方面已取得显著进展,但仍有一个关键挑战需要解决:无人机飞行员成员的动态管理。与基于协议的认证方案不同,先前研究中提到的基于机器学习的识别方案无法适应新加入的飞行员进行识别和认证,只能在现有飞行员飞行数据的帮助下取得成功。

1

如图1所示,一旦成熟的飞行员识别方案部署在飞行的无人机上,在飞行过程中仅能验证之前注册飞行员的合法身份。为保持较高的识别性能,这些基于机器学习的识别方案需要定期重新训练以更新其内部参数。由于飞行员操作隐私问题,无法获取之前注册飞行员的飞行数据,因此更新基于机器学习的识别方案会导致“灾难性遗忘”问题——在对新加入飞行员的飞行数据进行训练后,识别准确率会显著下降。即使可以获取之前注册飞行员的飞行数据,存储这些数据仍需要大量内存。为新加入的飞行员从头开始重新训练基于机器学习的识别方案也会带来大量系统开销成本。

为应对上述挑战,我们设计了一种基于任务增量学习的新型无人机飞行员识别方案。受先前研究的启发,我们首先设计了一个后台服务,通过订阅微对象请求代理(uORB)消息总线的主题来收集无人机飞行数据。随后,我们构建了一个从飞行数据中提取飞行员行为特征的模块,并在提取的飞行员行为特征与其提供的身份之间建立映射。为了适应新加入飞行员的识别,我们设计了一种更新机制,基于新注册飞行员的飞行数据调整内部结构和可训练参数。由于所提出的方案在系统开销极小的情况下,对新注册和之前注册的飞行员都具有较高的识别准确率,因此它提升了保护无人机免受飞行员身份伪装攻击的潜力。

本文的突出特点总结如下:

  • 我们提出了一种基于增量学习的新型无人机飞行员识别方案,用于保护无人机免受身份伪装攻击。

  • 为获取高质量的无人机飞行数据,我们设计了一个后台服务,在不改变硬件和软件架构的前提下,从uORB消息总线收集订阅的主题。

  • 为适应动态的飞行员成员管理,我们构建了一个可扩展的框架,并提出了一种更新机制,将新加入的飞行员纳入成熟的识别方案中。

  • 大量实验表明,所提出的方案能够在系统开销极小的情况下,对新注册和之前注册的飞行员保持较高的识别准确率。

PART/3     新算法框架解析   

无人机内部通信机制

随着动态航空技术和集成电路制造的发展,大多数飞行功能已集成到飞行控制器中,例如PX4。通过利用机载传感器测量数据,PX4可以监控无人机的飞行状态,并为飞行中的无人机提供导航和任务规划服务,从而减少飞行员的操作开销。根据,PX4是在Nuttx环境中实现的,其中不同的硬件模块被抽象为功能模块,为飞行控制栈提供可靠服务。此外,PX4还充当中间件,拦截飞行员的指令并将其转换为预设的无人机飞行姿态。

借助内部通信机制,PX4内部的模块可以通过发布和订阅预定义的主题来相互协作。具体而言,需要利用无人机飞行姿态进行计算的模块,首先订阅特定主题,然后创建一个监听器,以固定间隔接收机载测量数据。另一方面,需要发布其计算结果的模块也必须在uORB消息总线上申请一个主题,并通过申请的主题发布其结果。此外,PX4还利用扩展卡尔曼滤波算法融合机载传感器测量数据,并通过uORB消息总线发布高精度的无人机飞行姿态,以减少外部环境条件造成的副作用。由于高精度飞行数据在uORB消息总线上传输,我们设计了一个后台服务,从uORB消息总线订阅表1中列出的预定义主题,并将其用于无人机飞行员识别。

无人机飞行员身份伪装攻击

由于部署在开放环境中的无人机携带敏感信息,许多攻击者试图为了恶意目的捕获飞行中的无人机。与GPS欺骗攻击或中间人攻击等其他电子攻击相比,攻击者可利用被盗取的凭证发起身份伪装攻击,如图2所示。

图2

本文假设所有飞行员和飞行中的无人机必须首先在地面控制中心完成注册。之后,飞行员可在通信初始阶段利用其凭证进行双向认证。一旦其合法身份在无人机端得到验证,飞行员即可使用其远程无线电控制器向飞行中的无人机发送指令。另一方面,攻击者试图利用黑客工具从地面控制中心捕获飞行员的凭证。一旦获取到受害飞行员的凭证,攻击者就会利用这些被盗取的凭证获取飞行中无人机的控制权。由于基于知识的认证方案无法在飞行过程中验证飞行员的合法身份,攻击者可以伪装成受害飞行员,并利用其无线电控制器向飞行中的无人机发送恶意指令。

为保护无人机免受身份伪装攻击,我们提出了一种在飞行过程中验证飞行员合法身份的飞行员识别方案。由于受害飞行员与攻击者的操作特征存在明显差异,所提出的识别方案会将攻击者的飞行数据与当前飞行员的飞行数据区分开来。如果估计的身份与飞行员提供的凭证不匹配,该识别系统将触发警报。同时,PX4飞行控制器将停止执行接收到的指令,切换到自动模式,引导无人机在起飞地点降落,以阻止进一步的身份伪装攻击。

增量学习

增量学习由Schlimmer在中首次提出,其目标是使机器学习模型能够根据新生成的数据持续调整自身结构,以适应动态变化的环境。近年来,增量学习已成为一个重要的研究课题,并被应用于许多应用场景,如无线设备识别、智能手机伪造检测和自然语言处理。为了适应动态变化的环境,许多研究人员提出利用正则化方法来缓解灾难性遗忘问题。例如,Kirkpatrick等人在中提出了弹性权重巩固(ewc)方法,通过计算Fisher信息矩阵的对角线来实现。他们假设模型在每个任务后都会学习参数的重要性,同时忽略权重空间中学习轨迹上那些参数的影响。为了解决重要性高估问题,中的作者提出了记忆感知突触(mas)方法,将Fisher信息矩阵近似和在线路径积分融合到一个算法中,以计算每个参数的重要性。此外,中的作者提出了一种增量学习方法——学习不遗忘(lwf),在训练过程中利用温度缩放的logits来正则化数据偏移。除了上述的研究工作外,还存在一些其他技术,如复述方法,这些方法已被证明能有效提升增量学习性能。据我们所知,所提出的识别方案是首个将增量学习用于无人机飞行员识别的研究工作。我们将所提出的更新机制的性能与最先进的增量学习算法进行比较,以说明该算法的有效性。在自然和受限环境下的系统性实验表明,与对比算法相比,所提出的更新策略对之前注册和当前注册的飞行员具有更高的识别准确率。

基于无人机飞行数据的飞行员识别

数据收集与预处理

为了收集高精度的无人机飞行数据并最大限度减少外部环境造成的副作用,我们设计了一个后台服务,用于从uORB消息总线订阅选定的主题,而非从地面控制中心获取。由于外部天气条件和无人机机动性导致连接不稳定,通过mavlink协议传输到地面控制中心的数据完整性会被破坏,从而降低无人机飞行员识别性能。根据PX4文档,共有54个主题在uORB消息总线上传输,这些主题是专门为四旋翼飞行器框架设计的。为了筛选出最能描述飞行员行为特征的代表性属性,我们利用嵌入式特征选择算法过滤掉不相关的主题和属性。具体来说,我们首先选择五名飞行员的飞行数据来构建一个小型数据集,其中包含无人机飞行姿态、内部通信消息和飞行员提供的身份信息。然后,我们使用随机森林(RF)作为分类器,基于订阅的uORB主题中的属性来识别无人机飞行员身份。最后,我们按识别准确率从高到低对这些属性进行排序,并保留前28个属性以构建识别方案。

无人机飞行员识别

为使无人机飞行员识别方案适应动态成员管理,我们首先设计了一个基础框架,该框架可根据无人机飞行数据估计飞行员身份。受先前研究的启发,该基础框架由特征提取和飞行员识别模块组成,如图3所示。

3

在特征提取模块中,我们依次拼接三个卷积层,并在每个卷积层的输出端附加批归一化操作,以提取飞行员行为特征。卷积层利用局部参数共享机制来提取输入无人机飞行数据中的空间和时间关系。此外,批归一化被用于对卷积层的输出特征进行重新中心化和重新缩放,以促进梯度反向传播并降低梯度消失问题的发生概率。由于每个卷积层提取的负向表征在描述无人机飞行数据时具有物理意义,我们在构建的基础框架中去除了ReLU函数。

在飞行员识别模块中,我们利用一个全连接层在提取的隐藏表征与注册飞行员身份之间建立连接。全连接层可以为每个提取的隐藏表征分配适当的权重,就像一个仿射矩阵。通过利用反向传播机制,全连接层可以通过调整可训练权重来逼近飞行员的真实身份。为了使该识别方案适应动态的飞行员成员管理,全连接层的形式也可以根据当前注册飞行员的数量进行调整。如图3所示,我们首先将无人机飞行数据作为输入传入飞行员识别方案。通过一系列卷积操作和批归一化,我们逐步提取飞行员行为特征,其中紫色块代表卷积特征,绿色块代表批归一化特征。之后,我们将隐藏表征展平为一维(青色块),并在隐藏表征与预测的飞行员身份之间建立连接,其中红色块代表之前注册的飞行员,绿色块代表新加入的飞行员。一旦新注册的飞行员被纳入无人机系统,绿色块将被添加到之前构建的识别方案中红色块的末尾。关于识别方案的更新机制,我们仅利用之前构建的识别方案,在新注册无人机飞行员飞行数据的帮助下,引导生成新的识别方案。

无人机飞行员识别更新机制

一旦飞行员在地面控制中心完成注册,将获得获取无人机控制权的凭证。为了在飞行过程中验证该飞行员的合法身份,我们首先要求飞行员使用远程无线电控制器向无人机发送指令,以完成一些基本飞行任务。同时,我们利用之前设计的后台服务提取飞行数据Xn。我们将其凭证数字化为唯一数字,以在我们的识别方案中表示其身份。由于其他注册飞行员的飞行数据因操作隐私问题无法访问,我们仅利用Xn和之前构建完善的识别方案来优化修改后的网络结构的参数,旨在使所有注册飞行员都能获得较高的识别准确率。

如图3所示,我们首先将该识别方案的参数分为θs和θo,其中θs代表特征提取模块内的参数,θo代表飞行员识别模块内的参数。在为新注册飞行员更新飞行员识别模块时,我们首先在输出层添加节点(图3中的绿色块)。之后,我们在特征提取模块与新添加的节点之间建立连接θn。连接的数量等于新添加的飞行员数量乘以特征提取模块提取的输出特征数量。我们用随机高斯分布初始化θn,然后按以下流程更新该识别方案。在更新流程的初始阶段,我们首先冻结参数θs和θo,并利用新注册飞行员的飞行数据Xn训练参数θn直至收敛。然后,我们利用Xn训练包括θs、θo和θn在内的所有网络参数直至收敛。由于我们只能利用当前注册飞行员的数据θn来更新无人机飞行员识别方案,新注册飞行员的优化目标是最小化预测身份与飞行员提供的真实标签之间的距离。我们使用公式(5)来描述新注册飞行员的优化目标。

PART/4     实验及可视化    

环境设置

由于四旋翼飞行器操作简便且应用广泛,备受关注,我们在P450和S500等四旋翼飞行器上开展实验,以验证所提出识别方案的有效性。在数据收集中,我们要求15名学生在自然和受限环境中操控四旋翼飞行器。对于由AmovLab生产的P450,其配备了景深和光流传感器,为无人机提供可靠的飞行性能。至于S500,我们在CUAV飞行栈的指导下从头构建了它。我们使用Futuba远程无线电控制器捕获飞行员指令,并向飞行中的无人机发送控制信号。在受邀的飞行员中,我们要求航模队的5名学生担任专业飞行员,其余来自我们实验室的则是业余飞行员。图4详细展示了参与者的操作熟练度,我们用飞行时长来代表他们的操作经验。

为验证所提出识别方案的有效性,我们在P450和S500上开展了实验,如图5所示。

图5

我们首先要求参与者在自然环境中操控P450执行交通监控任务,这是四旋翼飞行器最常见的飞行任务。具体而言,飞行员使用远程无线电控制器向无人机发送指令,使其起飞、空中悬停并在预设目的地降落。同时,要求飞行员录制三分钟的交通状况视频。此外,我们在受限环境中开展实验,其设置符合的要求。我们预设了飞行轨迹,要求飞行员操控无人机无碰撞地穿过航点。为减少外部天气条件造成的副作用,所有受限环境下的数据均在晴天收集。

我们还在S500的自然和受限环境中采用类似设置开展实验,以进一步说明所提出识别方案的有效性。为收集足够的数据,所有参与者需操控无人机飞行十次,我们利用设计的后台服务监控无人机的飞行状态。关于真实标签的生成,我们将飞行员提供的凭证数字化,并映射为唯一数字,以此作为实验中的真实标签。表2详细列出了实验设置,部分收集的数据已在https://github.com/FRTeam2017/DronePilotIdentification.git 上公开。

基于P450的无人机飞行员识别

在本节中,15名飞行员需使用P450在自然和受限环境中完成飞行任务,如图5所示。为了收集足够的无人机飞行数据,我们要求他们在自然和受限环境中分别重复执行飞行任务十次。我们将前八个轨迹用于训练,其余用于测试,这种划分符合机器学习和模式识别算法的要求。此外,训练轨迹和测试轨迹之间没有重叠。数据预处理后,我们在自然环境中获得了54,123个训练样本和11,254个测试样本,在受限环境中获得了49,938个训练样本和11,432个测试样本。表3详细列出了基于P450在不同环境设置下的无人机飞行员识别性能,其中P*代表无人机飞行员识别方案将分类的样本,T*表示基于给定飞行数据的估计结果。

基于S500的无人机飞行员识别

为进一步说明所提出识别方案的有效性,我们也在S500上开展了相同的实验。我们要求所有飞行员在自然环境中使用S500进行交通监控,并在受限环境中穿过沿航点预设的拱门。为了收集足够的无人机飞行数据,所有飞行员被要求重复执行任务十次。我们将前八次的飞行数据用于训练,最后两次用于测试。数据预处理后,我们在自然环境中获得了62,118个飞行样本,在受限环境中获得了58,921个飞行样本。

详细列出了所提出无人机飞行员识别方案的性能,其中P*和T*的含义已在表3中说明。

所提出的无人机飞行员识别方案在S500无人机上取得了相近的准确率。根据表4,有八名飞行员的识别准确率超过95%。在受限环境中取得了82.17%的最低识别准确率,在自然环境中取得了88.47%的最低识别准确率。最低识别准确率的原因同样是由外部天气条件因素导致的。由于在自然和受限环境中,S500的平均识别准确率分别为93.95%和94.23%,我们可以得出结论:所提出的方案在不同的四旋翼飞行器上能够保持较高的识别性能。

讨论

在本文中,我们提出了一种新颖的无人机飞行员识别方案,用于保护无人机免受冒名攻击,并提出了一种适应动态飞行员成员管理的更新机制。为了验证所提出识别方案的有效性,我们在不同环境设置下的P450和S500上开展了实验。尽管取得了令人印象深刻的结果,但我们提出的识别方案仍然存在一些挑战。 

首先,识别性能还有进一步提升的空间。表3和表4中的数值结果表明,所提出的识别方案能够以较高的识别准确率识别大多数飞行员。然而,一些飞行员,如表3中的第十名飞行员,仍然无法被很好地识别。一个可解释的原因是,风等外部天气条件可能会改变飞行员在飞行过程中为保持稳定而产生的行为特征,而所提出的识别方案并未考虑不同天气条件下飞行员的行为特征。在未来的工作中,我们将设计一种更智能的识别方案,该方案可以利用天气条件鲁棒特征进行无人机飞行员识别。 

其次,应利用不同的识别场景进一步验证所提出的更新机制。本文在类似的实验设置下验证了所提出的更新机制对新加入飞行员的适配性。在实际应用场景中,新加入飞行员的飞行数据可能来自不同的环境,这可能会对所提出识别方案的性能产生副作用。此外,还应考虑注册飞行员离开的场景,以增强动态无人机飞行员成员管理。

第三,应在不同类型的无人机上开展更多实验,以验证所提出识别方案的有效性。本文仅在预设的自然和受限环境中,在P450和S500上验证了所提出识别方案的有效性。随着更多类型的无人机被设计并投入应用场景,必须在无人机端部署更通用、更鲁棒的识别方案,以进一步减少飞行员冒名攻击。

THE END !

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值