时间序列预处理:技术与实践
1. ROCKET方法
ROCKET(RandOm Convolutional KErnel Transform)是一种用于时间序列卷积的新方法,它能提高机器学习模型的准确性并加快训练速度。该方法借鉴了卷积神经网络的成功经验,并将其应用于时间序列数据集的预处理。
1.1 卷积基础
卷积是一种重要的变换,在图像处理中尤为关键,也是图像识别深度神经网络的重要组成部分。卷积通过前馈连接(滤波器或内核)应用于图像的矩形区域,生成的图像是内核在整个图像上滑动的结果。例如,一个锐化内核如下:
[
0
-1
0
-1
5
-1
0
-1
0
]
将这个内核应用于图像的局部邻域,可得到更清晰的图像。
1.2 ROCKET特征计算
ROCKET从每个内核和特征卷积中计算两个聚合特征:
- 全局最大池化 :输出卷积结果中的最大值。例如,卷积结果为0,1,2,2,5,1,2,全局最大池化返回5。
- 最大池化 :在指定池大小内取最大值。如池大小为3,输出为2,2,5,5,5。
- 正比例值(PPV) :卷积结果中正值(或高于偏置阈值)的比例。
通过应用卷积内核变换,可以提高时间序列机器学习的准确性。每个特征由随机内核变换,默认内核数量为10,000。变换后的特征可作为输入用于任何机器学习算法,建议使用线性算法,如岭回归分类器或逻辑回归。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



