SETTER:基于RNA二级结构的三级结构相似性算法
1. 引言
生物体内的主要成分核酸和蛋白质都是生物聚合物,由称为单体的构建块序列组成。蛋白质是细胞的活性元素,而其合成指令存储在脱氧核糖核酸(DNA)中。DNA由四种核苷酸组成,每个核苷酸包含一个碱基(腺嘌呤A、鸟嘌呤G、胞嘧啶C、胸腺嘧啶T)、一个脱氧核糖和一个磷酸基团。基因作为蛋白质合成的指令,决定了在特定时间和位置表达的蛋白质。DNA中的碱基通过氢键稳定配对,A与T、C与G形成规范的碱基对。
由于DNA非常珍贵,不能直接用于蛋白质表达,遗传信息首先转录为核糖核酸(RNA)。RNA的基本构建块与DNA相似,但有两个重要区别:胸腺嘧啶被尿嘧啶(U)取代,脱氧核糖被核糖取代。大多数RNA分子是单链的,但在生物条件下会形成独特的三维构象。RNA的生物学功能与其构象直接相关,因此研究生物聚合物的三维结构对于理解生物体的内部运作非常重要。已解析的结构(即分子中所有原子的xyz坐标)存储在PDB数据库中,供广大科学界免费使用。
单链RNA分子具有非常复杂的三维结构,核糖的存在引入了额外的氢键位点,允许形成各种非规范碱基对。RNA结构具有层次性,可分为一级(RNA序列)、二级、三级和四级结构。RNA二级结构基序可以定义为双螺旋与各种环结构的组合,根据这些简单元素的相互位置进行分类。常见的环结构包括发夹环、内部环和连接环。RNA基序在SCOR数据库中根据功能、三维结构或三级相互作用进行分类。
目前,PDB数据库中存储了大量的RNA结构,这使得对RNA结构空间的分析和表征成为可能,有助于了解RNA的功能。由于三维结构通常比序列更具进化保守性,检测RNA分子之间的结构相似性可以揭示其功能,而这仅通过序列信息是无法实现的。因
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



