时间序列交叉验证

本文遵循时间序列机器学习的方法,推荐使用滚动原点评价(又称滚动原点再校准评价)进行交叉验证,这是一种嵌套交叉验证形式,能提供接近无偏的误差估计。在确保训练、验证和测试集的机构一致性的前提下,通过减少初始数据集的预测者数量,解决优化问题,形成三个阶段各自包含约10个机构的数据集。
AI助手已提取文章相关产品:

来源

https://www.mdpi.com/1099-4300/21/10/1015/htm#FD3-entropy-21-01015

翻译

#For cross-validation, we follow the time-series machine-learning literature and propose the use of rolling-origin evaluation [24], also known as rolling-origin-recalibration evaluation [25]. These are forms of nested cross-validation, which should give an almost unbiased estimate of error [23]. Once the number of institutions (forecasters) that we could be used to properly define the training, validation and test sets are selected, we can start to solve the optimization problem. As we will have already noticed, the institutions must be the same in the training, testing and validation sets. If this condition is not fulfilled, the problem will not be well defined. To solve this issue, in our application (see Section 4), the dimensionality of the initial data bank was reduced from 21 to around 10 forecasters satisfying the condition of existence of data for the three phases. This gives us three sets of data sampling with around 10 institutions for each phase.

为了进行交叉验证,我们遵循时间序列机器学习文献,并建议使用滚动原点评价[24],也称为滚动原点再校准评价[25]。这些都是嵌套交叉验证的形式,它应该给出错误[23]的几乎无偏估计。一旦我们可以用来正确定义培训、验证和测试集的机构(预报员)的数量被选定,我们就可以开始解决优化问题。
正如我们已经注意到的,这些机构在培训、测试和验证集上必须是相同的。如果不满足这个条件,这个问题就不会得到很好的定义。为了解决这一问题,在我们的应用中(见第4节),将初始数据库的维数从21个降至满足三个阶段数据存在条件的预测者10个左右。这给了我们三组数据采样,每个阶段大约10个机构。

您可能感兴趣的与本文相关内容

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值