多元时间序列分析与犯罪新闻异常检测
多元时间序列分析
特征选择
在多元时间序列分析中,采用交叉验证方法(10折)进行特征选择。结果显示,对于区间a选择了38个特征,对于区间b选择了45个特征。
RQA转换 - 向量方法
运用向量递归概念,在相关方程中,DV (i) 和DV (j) 是d维向量,并计算向量差在Rd中的范数。在本次实验中,使用欧几里得范数,并结合特定组合。当确定RP矩阵(RP[τ,m,RR])计算的最优参数后,生成相应矩阵并提取14个RQA测量特征,包括递归率(RR)、确定性(DET)等。最后,将区间a和区间b的信息从19个属性压缩到14个属性。
机器学习算法
为了获得特征排名,在个体转换方法中使用XGBoost。为了比较两种方法,采用特定算法生成预测模型。同时,加入使用原始时间序列(19个属性)的先前研究结果,使用的模型基于人工神经网络(前缀“nn”)和支持向量机(前缀“svm”)。
结果
使用ROC曲线下面积(AUC)指标验证无监督转换的预测能力,比较个体方法(前缀“gbm individual”)和向量方法(前缀“gbm vector”)的结果。所有随机分类模型执行50次,结果表明,在区间a中个体方法获得最佳结果,在区间b中向量方法表现最佳,且两种方法均优于先前结果。
| 方法 | 区间a | 区间b |
|---|---|---|
| 个体方法 |
超级会员免费看
订阅专栏 解锁全文
9

被折叠的 条评论
为什么被折叠?



