基于决策树算法的AIS数据损坏检测
1. 引言
在AIS(自动识别系统)数据处理中,检测和处理损坏的消息至关重要,因为错误的数据可能会导致严重的后果,如船舶碰撞等。理想的算法应具备低计算复杂度,并且能够检测出AIS消息中的损坏,无论船舶的行为是否典型。
2. 损坏检测方法
2.1 独立簇中的损坏检测
- 背景 :为了找到可能的异常AIS消息,可搜索聚类后形成独立单元素簇的消息。若聚类算法将某些消息放置在远离其他点的位置,可能表明这些消息字段包含异常值,即已损坏。例如,通过辅助测试发现,某些位(如船舶标识符MMSI、航行状态、特殊操纵指示符以及地面速度、经度和纬度的最高有效位)的损坏会使消息成为单元素簇。
- 确定消息来源 :找到损坏的消息后,还需确定其哪部分实际损坏。为此,使用k最近邻分类器将消息分配到正确的簇中。具体步骤如下:
- 聚类算法为消息分配的簇索引作为分类标签。
- 找到与异常消息最接近的k = 5条消息。
- 这些消息中大多数所属的簇成为异常消息的新组。
-
检测异常字段 :基于小波变换提出了一种检测AIS消息字段异常的特殊算法。对于每个分析字段,计算两个波形的小波变换:
- $\Delta \hat{win}$:由给定字段中连续值的差值组成。
- $\Delta win$:与$\Delta \hat{wi