简介:
本文提出了Flare Transformer,一种通过磁图模块( MM )和太阳黑子特征模块( SFM ) 同时处理图像和物理特征的太阳耀斑预测模型。引入Transformer注意力机制对输入特征之间的时序关系进行建模。还引入了一个新的可微损失函数来平衡Gandin–Murphy–Gerrity和Brier skill这两个主要指标。在公开的数据集上验证了模型。
本文预测未来24 h内发生的最大太阳耀斑等级。输入是HMI全日面视向磁图的时间序列和从活动中提取的区域级物理特征。输出为预测的太阳耀斑等级。
Physical feature包含六十几个特征,包括了磁中性线、螺旋度、紫外线增亮和耀斑历史。
方法:
寻常的耀斑预测通常利用单独的物理特征或者图像特征,但在本文中提出了两个模块同时进行处理两种特征。
提取f_t使用Nishizuka, N., Sugiura, K., Kubo, Y., Den, M., Ishii, M.: Deep flare net (DeFN) model for solar flare prediction. The Astrophysical Journal 858(2), 113 (8pp) (2018)所提出的方法。v_t将图像缩放到512尺度。
MM和SFM的不同之处在于源-目标注意力中的query。在MM中,磁图特征作为query,而在SFM中,物理特征作为query。MM首先对图像Vt - k + 1:t进行编码:以及对物理特征进行编码:
通过Concat得到h_{vf}。
N_v Transfomer layer计算时序图像与物理特征之间的时序关系。QKV的值和h_trm的输出如下:
最终预测耀斑分类的y值:
对于Loss函数,引入了GMGS和BSS。
(GMGS是一种使用GMGS得分矩阵考虑类别不平衡的多类别评价度量)
现有方法中使用的损失函数在改善GMGS方面效果不佳,因为它们使用与GMGS无关的权重来调整类之间的平衡。与现有方法不同的是,通过使用GMGS的得分矩阵作为权重。由于BSS损失是可微的,直接使用BSS损失。
其中,L_{CE}表示交叉熵损失,λ_GMGS和λ_BSS表示损失权重。得到最终的Loss。
结果:
在实验中,使用SDO中每小时的视线磁图以及该网页上的在线物理特征数据库。
最终实验结果如下,DeFN和DeFN-R给出的结果由复现得到。用GMGS,TSS≥M 和BSS≥M对模型进行评估:
预测的样本。其中ab为正确样例,c为X级,但被预测为M级太阳耀斑
问题:
对Physical feature的描述比较模糊,在模型中助力有多大?
先看论文再回来解决这个问题。