深入探寻可变剪接的判别特征
1. 引言
如今,生物学领域面临的一大挑战是阐明可变剪接的全貌,因为它是产生蛋白质组功能复杂性的核心机制。过去很长一段时间,人们认为可变剪接是罕见事件,多数情况下,开放阅读框(ORF)特有的外显子序列会被拼接。然而,大型基因组测序项目的完成揭示了后生动物大量使用可变剪接。例如,2001 年公布的人类基因组草图显示,基因数量约为 30,000 - 40,000 个,远低于此前估计的超过 100,000 个。
检测可变前体 mRNA 剪接事件的调控序列元件是一个重要的子问题。此前,已有研究聚焦于组织,检测组织特异性可变剪接的候选内含子调控序列元件,也有研究总结了 5’和 3’剪接位点以及外显子元件的调控元件。
可变前体 mRNA 剪接事件可分为多种类型,如盒式、互斥、可变 3’剪接位点、可变 5’剪接位点和内含子保留等。检测与特定类型可变剪接事件密切相关的调控序列元件,对于理解可变剪接机制至关重要,但目前对其进行的广泛计算分析还不足。
本文旨在寻找可变 5’剪接位点、可变 3’剪接位点和盒式剪接类型在其可变外显子及其侧翼内含子上的特异性调控序列模式。所使用的可变剪接数据来自 Lee 的 ASAP(可变剪接注释项目)数据库。采用的方法基于多种特征设计,考虑了 DNA 序列上的各种模式,如带错配的 I - 聚体、简并模式和核酸索引等。由于所有模式都可表示为二元函数,因此可以轻松处理它们的合取和析取,并对这些复合模式进行评估。
2. 材料与方法
2.1 数据
Lee 等人整理了与可变剪接相关的信息,并将结果作为在线数据库 ASAP 提供。该数据库的文本文件可从 http://
超级会员免费看
订阅专栏 解锁全文
8万+

被折叠的 条评论
为什么被折叠?



