可扩展高斯过程回归在材料属性预测中的应用
1. 研究背景与相关方法
在材料属性预测领域,不同学者采用了多种方法。部分人倾向于热力学框架或纯经验方法,这些方法曾被深入研究。研究发现,热力学方法虽能给出令人满意的结果,但在查询点上存在严格限制;神经网络方法表现与其他方法相当,但会有一些不合理的预测,因此有人建议使用贝叶斯框架。
对于高斯过程处理高维大量数据的问题,有学者提出对数据进行分区的方法,这也是本文采用的思路。在高维大量数据聚类方面,有一种有效的共聚类方法被提出,虽该方法用于多媒体相似度搜索,不完全适用于含化学成分的数据库,但为本文提供了灵感。
2. 高斯过程回归(GPR)
高斯过程(GP)是高斯概率分布的推广,本质上是多元高斯分布的扩展,不仅考虑随机向量上的高斯分布,还考虑随机函数上的高斯分布。平稳高斯过程回归(GPR)是计算机实验数据的经典统计模型,与其他贝叶斯回归算法一样,GPR基于先验分布(训练数据)计算后验分布,在高维空间的函数逼近方面表现出色。
GPR的协方差矩阵定义如下:
[K(\vec{X}, \vec{X} {\cup}) = \theta_f^2 \exp \left{-\frac{1}{2} \sum {j=1}^{n} \frac{(x_i - x_{\cup j})^2}{d_j} \right} + \theta_n^2 \beta(\vec{X}, \vec{X}_{\cup})]
其中,(\beta)是克罗内克δ函数,(\theta_f^2)表示函数方差,(d)表示高斯核的宽度。
要进行GPR,需要生成协方差矩阵(K),其元素是训练数据点对所
超级会员免费看
订阅专栏 解锁全文

1180

被折叠的 条评论
为什么被折叠?



