生信各基础名词解释

声明:本文主要讲解的是人(即真核生物)的各名词解释。

遗传中心法则如下:

图片

简单解释:

 具体解释如下:

Alternative splicing(选择性剪接):mRNA前体通过不同的剪接方式产生不同的mRNA剪接异构体,产生结构或功能各异的最终蛋白产物。

cDNA:是以mRNA为模板,在适当引物的存在下,由mRNA经过反转录而得到的DNA,是mRNA链互补的DNA链,其内部已无内含子等结构,值得说明的是,目前火热的二代测序均是先将RNA反转录组成cDNA再进行测序的。

CDS(coding sequence,编码区):,指mRNA中编码蛋白质的那段序列,即CDS是编码蛋白产物。CDS是已知的一个基因上确确实实翻译成蛋白质的区段,成熟mRNA中由一个或几个exon组成。DNA分为编码区和非编码区,非编码区具有基因表达的调控功能,如启动子就在非编码区。编码区则转录为mRNA并最终翻译成蛋白质。

密码子(codon:mRNA上的3个相邻碱基,共有4的3次方种,即64种,其中决定氨基酸的密码子有61种,决定20种氨基酸(C1/4+2C2/4+C3/4=20氨基酸),另外,UAA、UAG、UGA这三个密码子不能决定任何氨基酸。换句话说,密码子指的是在蛋白质合成时,代表某一种氨基酸的规律。

反密码子:位于tRNA上的与mRNA上的密码子互补配对的3个碱基。

起始密码子(iniation codon):指定蛋白质合成起始位点的密码子。最常见的起始密码子是AUG甲硫氨酸或GUG缬氨酸。
终止密码子(termination codon):任何tRNA分子都不能正常识别的,但可被特殊的蛋白质结合并引起新合成的肽链从翻译机器上释放的密码子。存在三个终止密码子:UAG,UAA和UGA。

启动子(Promoter):是特定基因转录的DNA区域,在基因的非编码区,即编码区的上游,转录mRNA的时候与RNA聚合酶结合的位点,告诉RNA聚合酶从启动子开始转录但启动子本身并不被转录。即,启动子一般位于基因的转录起始位点,5‘端上游,启动子长约100-1000bp。在转录过程中,RNA聚合酶与转录因子可以识别并特异性结合到启动子特有的DNA序列(一般为保守序列),从而启动转录。启动子本身并不转录而且也不控制基因活动,而是通过转录因子结合来调控转录过程。在细胞核中,似乎启动子优先分布在染色体区域的边缘,可能是在不同染色体上共同表达基因。此外,在人类中,启动子显示出每个染色体特有的某些结构特征。

终止子(Terminator):终止子也在基因非编码区,即编码区的下游,处于基因或操纵子的末端,是告诉RNA聚合酶转录到此结束的DNA序列。(注意:终止子和启动子不同,启动子由DNA序列来提供信号,但真正起终止作用的不是DNA序列本身,而是转录生成的RNA,这是因为转录的终止指的是:转录进行到一定程度,会停止下来,复合物解体,新生RNA 释放出来。)

总结一下,启动子、终止子与起始密码子、终止密码子的区别是:

        启动子和终止子都是一段特殊的DNA序列,属于基因的非编码区,分别位于编码区的上游和下游,负责调控基因的转录,且长度远不止三个碱基。而起始密码子和终止密码子都是mRNA上的三联体碱基序列(均只含三个碱基),分别决定翻译的起始和终止。

 

mRNA(message RNA,信使RNA):指的是,基因转录产生的RNA,也称为转录本。由于剪接等因素,一个基因转录常常可以形成多个mRNA。

前体mRNA到成熟RNA:由DNA转录后先形成前体mRNA(pre-mRNA),这些未成熟的mRNA需要经过一定的加工,如剪接去除内含了5端加一个7-甲基鸟首酸“帽子”,3'端加上一个多聚腺甘酸尾,最后形成较短的有功能的成熟mRNA。根据功能,成熟mRNA可分为:5'UTR、ORF、3'UTR

UTR(Un-translated region,非翻译区): 成熟mRNA 位于编码区(CDS)上下游的不翻译为蛋白质的区域。

        5'UTR (5'Un-translated region) :是指从5端帽子到翻译起始码AUG的序列,由于其不被翻译,称为5’非翻译区。功能: 起调控作用,mRNA在翻译过程中可形成发夹结构Q,对翻译起始形成障碍。

        3'UTR (3' Un-translated region): 从终止密码子到mRNA 3’未端的拖尾序列。功能:不被翻译,但对提高翻译效率具有重要作用。

Exon, Intro: 指外显子和内含子,均属于编码区

        内含子(Intron)指的是DNA链或前体mRNA上不能编码蛋白质的核苷酸片段基因;

        外显子(Exon)指的是DNA链或前体mRNA上能够编码蛋白质的核苷酸片段。Exon包括CDS和UTR。

ORF(Open reading frame,开放阅读框):是指,任意一段序列,只要起于ATG止于终止子,都可以叫做ORF。换句话说,ORF是从一个起始密码子开始到一个终止密码子结束的序列;但不是所有ORF都能表达出蛋白产物或具有生物学功能的蛋白产物。即ORF不一定是CDS而CDS一定是一个ORF,也可能包括多个ORF。ORF是一种预测,而不是一种已知的翻译区。即随意写下一段DNA序列,只要以三个碱基为单位能找到ATG和终止子,就可以称作ORF,这段ORF甚至可能不是一段真正存在的DNA序列,但是它仍然是ORF。一段序列是可以有多个ORF的,只有当ORF符合已知的可翻译成蛋白的序列时,才能等同于CDS。

总结:

        一个mRNA可能有多个CDS,一个CDS也可能有多个Exon。

        ORF不一定是CDS而CDS一定是ORF,也可能包括多个ORF。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值