小角X射线散射谱的并行GPGPU评估
1 引言
在生物分子研究中,高通量数据采集已成为可能。小角X射线散射(SAXS)数据仅描述了整体平均构象电子密度的球平均,因此需要额外信息辅助结构解释。常见的蛋白质结构测定方法,如基于马尔可夫链蒙特卡罗(MCMC)模拟的方法,会提出合理的结构构象,并通过正向模型计算相关模拟数据,然后使用实验误差模型比较模拟数据和实验数据。这就需要一种高效的方法来采样蛋白质结构并计算模拟数据。
2 方法
2.1 正向SAXS计算
SAXS实验中观察到的数据是一维强度曲线 $I(q)$,在离散的散射动量 $q = 4\pi \sin(\theta)/\lambda$ 处测量,其中 $\lambda$ 是入射辐射的波长,$2\theta$ 是入射光束与散射光线之间的夹角。从给定原子结构计算理论SAXS谱基于著名的Debye公式:
[I (q) = \sum_{i=1}^{M} \sum_{j=1}^{M} \frac{F_i (q) F_j (q) \sin(q \cdot r_{ij})}{q \cdot r_{ij}}]
其中 $F_i$ 和 $F_j$ 是单个粒子 $i$ 和 $j$ 的散射形状因子,$r_{ij}$ 是它们之间的欧几里得距离,求和涵盖所有 $M$ 个散射粒子。
2.2 粗粒度蛋白质模型
如果一些散射体相对固定,可以用单个大散射体(虚拟体)近似。这种近似在低 $q$ 时更精确,随着散射角增大,在达到虚拟体散射直径对应的分辨率时逐渐失效。研究发现,蛋白质链中的氨基酸可以用一个或两个大物体(虚拟原子)近似,且这种近似在当前实验标准通常未测量的散射角范围内成