本模型结合频繁模式常用算法FP-tree 算法进行频繁线路预测,同时对频繁线路进行相关属性聚类,采用DBSCAN,进行线段聚类(相关的FP-tree和DBSCAN会后续总结)
一、需求分析
主要针对①每艘船舶经常走的起止港口及经停港口;②每类船舶(分不同吨位等级、分不同长度等级、分不同宽度等级、分不同吃水等级)经常走的真实航迹线。数据统计周期为每个季度和每年。
统计数据内容如下:
1、每艘船舶
(1) 常走起止港口、经停港口
(2) 常走航迹线
(3) 港口平均停留时间
(4) 经停港口间的平均行驶时间
(5) 从某个泊位出来经常到某个港口(主要用于船舶在运送不同类型的货物的时候,可能目的港口不同,这个作为后续优化方向)
2、港口间真实航迹线
(1) 港口与港口间的真实航迹线
(2) 航迹线的属性:①可以航行哪些类型的船舶;②分类型的船舶的最大吨位;③可以航行船舶的最大长度;④可以航行船舶的最大宽度;⑤可以航行船舶的最大吃水深度。
二、输入输出输出
2.1 输入数据
1)船舶的OD数据;
2)船舶的AIS数据;
3)船舶的类型数据;
三、模型
3.1 模型主要思路
1. 通过OD数据统计船只在一个季度/年内的所有抵达港口,并统计其在该港口的平均时间、到港的次数、以及该船只在所有港口停留的平均时间。按照到港的次数进行排序,得到到港次数大于等于2次(若数量少于3个,则取前三个;次数出现一次的港口排序按照在港时间,时间长的排在前边)的港口为标记港口;
2. 统计船只的航线的起始港口,并记录途中经停港口。
3. 通过统计的起始航线,运用FP-tree频繁统计方式来计算船只的频繁线路。
4. 通过船只O