基于机器学习的日冕物质抛射自动预测
1. 样本划分与性能评估
在处理有限数量样本时,为了对分类器的性能进行正确的统计评估,通常采用将样本划分为训练集和测试集的方法。具体操作是使用随机数生成器来决定哪些样本用于训练分类器,哪些用于测试。分类误差主要取决于所使用的训练和测试样本。对于有限数量的样本,可以使用误差计数程序来估计学习算法的性能。
在相关实验中,采用 80% 随机选择的样本进行训练,剩余 20% 用于测试。日冕物质抛射(CME)的预测性能使用 ROC 曲线进行评估,使用两个性能指标:真阳性(TP)率和假阳性(FP)率,计算公式如下:
- TP 率 = 正确的阳性预测 / 总阳性数
- FP 率 = 错误的阴性预测 / 总阴性数
其中,“正确的阳性预测”是系统正确预测耀斑会产生 CME 的总案例数;“错误的阴性预测”是系统错误预测耀斑不会产生 CME 的总案例数;“总阳性数”是耀斑产生 CME 的案例总和(测试中使用的关联案例数);“总阴性数”是耀斑未产生 CME 的案例总和(测试中使用的非关联案例数)。
2. 学习算法的优化
为了确定 CCNN 和 SVM 这两种机器学习算法哪种更适合该应用,对它们的预测性能进行了比较。在比较之前,需要对这两种学习算法进行优化,以确保达到最佳性能。
2.1 CCNN 的优化
CCNN 在处理目录中的太阳数据时能提供最佳的神经网络性能,但在当前应用中仍需进行优化。这里使用的 CCNN 由输入层、隐藏层和输出层组成,输出层有一个输出节点,若预测会发生 CME,其数值为 0.9,否则为 0.1。
优化实验步骤如下:
超级会员免费看
订阅专栏 解锁全文
1158

被折叠的 条评论
为什么被折叠?



