首先介绍一下做药效团筛选的背景:
计算机辅助药物设计的主要方式包括两种:
1.基于受体的药物设计;
2.基于配体的药物设计;
由于大量蛋白质的晶体结构仍然是未知的,尤其是膜蛋白,膜蛋白及其疏水的特性使其纯化结晶变得很困难。对晶体结构的未知靶点,当存在多种的结构类似的配体时,可以使用基于药效团的药物设计方法。
接下来介绍一下什么是药效团,关于药效团,书中是这样介绍的:在成药靶点中必定存在着与药物结合的特异性结合位点。对某个靶点发挥活性的化合物在结构特征上必定有相似之处。这些化合物的最普遍的共有特征被定义为药效团。IUPAC将药效团定义为“确保与特定生物靶标的最佳相互作用并触发其生物反应”所需的空间和电子特征的集合。
RDkit是诺华公司开发的一款处理化学信息学问题的工具包,底层由C++编写,其中集成了多数化学信息学处理方法及工具。
rdkit中的药效团信息是以分子指纹的形式呈现的,以SMART编码的形式呈现,具体可参考这篇文献:
https://pubs.acs.org/doi/abs/10.1021/ci7003253https://pubs.acs.org/doi/abs/10.1021/ci7003253其中分子结构信息是以一个三元组的形式存储下来的,包含所有可行的组合:(参与原子数point,原子类型patterns,距离distance bins)均为一位(bit),形成具有固定长度的药效团指纹(pharmacophore fingerprints)。
注:同一个原子可以被分配于若干种原子类型。