本文内容速览:

在生物学研究中,“基因突变”是一个亘古不变的话题,其不仅是遗传变异的主要驱动力,也是决定生物表型差异和环境适应力的重要分子基础。得益于高通量测序技术与生物信息学分析方法的发展,我们可以通过比较不同表型材料之间的基因组水平差异,从而正确定位到关键的表型相关基因。早在“天壤之别,竟然只来自一个碱基的作用!”一文中,小远就给大家介绍了基因不同区域的单碱基变异。同时在日常和老师的沟通过程中,发现不少老师的研究涉及到基因不同区域的变异,那么该如何进行研究呢?本文将从编码基因的外显子、内含子、启动子以及UTR区域变异出发,给大家介绍相关的研究思路~
01
外显子突变
在真核生物中,基因经过RNA的选择性剪切去除内含子,外显子被拼接形成编码序列即我们常说的CDS序列,随后通过翻译合成对应的蛋白质。外显子是编码蛋白质的核心,决定了蛋白质的结构和功能。因此可以从多个方面入手,比如分析蛋白结构变化、亚细胞定位差异、蛋白表达水平和组织特异性表达模式。同时,还可以结合转基因植株表型差异去分析。如果蛋白之间存在互作关系,还可以检测突变是否改变了互作能力。若目标基因是转录因子,则可进一步研究其对同一下游靶基因的调控差异。
2025年6月,中国农业科学院油料作物研究所顿小玲课题组在Plant Biotechnology Journal杂志上发表了一篇题为“A chaperonin BnaC01.CCT8 contributes to silique length and seed weight by affecting auxin and jasmonic acid signalling in Brassica napus”的研究论文。作者通过乙基甲磺酸(EMS)诱变获得了一个角果长度(SL)、种子长度(SW)均下降的突变体油菜(ssl),利用图位克隆、混池测序、SNP分子标记技术确定了与表型最为相关的170kb的区间。随后基于甘蓝型油菜半冬性自交系D11和ssl突变体的全基因组重测序,发现BnaC01G0509300ZS(BnaC01.CCT8)的第12外显子57361321位点鉴定出一个SNP(C到T),导致TCP1 theta/chap CCT theta结构域预测的α螺旋结构中丙氨酸被缬氨酸取代(A507V)(图1a-c),结合前人的文献报道作者将BnaC01.CCT8A507V作为ssl中调节SL和SW的候选基因。
亚细胞定位实验表明BnaC01.CCT8与BnaC01.CCT8A507V均定位于细胞核和细胞质(图1d)。将二者分别异源过表达至拟南芥atcct8-2突变体、Col-0野生型中发现,在atcct8-2背景下,BnaC01.CCT8可以回补短茎表型、种子宽度,BnaC01.CCT8A507V无影响;在Col-0背景下,BnaC01.CCT8-OE的SL显著延长、种子增大,BnaC01.CCT8A507-OE则无差别。通过Pull-down实验、Split-LUC实验、BiFC实验验证了BnaC01.CCT8与BnaA09.ARF18(通过生长素响应途径调控角果壁细胞的生长)之间的相互作用,结果表明BnaC01.CCT8与BnaA09.ARF18存在相互作用,与BnaC01.CCT8A507V不存在相互作用(图2)。综上,表明A507是关键的突变位点。

图1 BnaC01.CCT8的变异、亚细胞定位及表型分析(Qu et al., 2025)。(a)BnaC01.CCT8的基因结构。第12个外显子中ssl基因的突变以C>T表示。黑色条形代表外显子;线条代表内含子;灰色条形代表非翻译区;(b)BnaC01.CCT8的蛋白质结构。由丙氨酸(Ala)替换为缬氨酸(Val)以A507V突出显示。蓝色条形代表TCP1 theta/chap CCT theta保守结构域,数字表示氨基酸位置;(c)BnaC01.CCT8和BnaC01.CCT8A507V的三维结构预测和比较;(d)烟草中BnaC01.CCT8-GFP和BnaC01.CCT8A507V-GFP融合蛋白的亚细胞定位,DAPI为核染料。

图2 BnaC01.CCT8和BnaA09.ARF18之间的相互作用(Qu et al., 2025)。(a)在烟草叶片中进行BiFC实验;(b)在烟草叶片中进行Split-LUC实验;(c)Pull-down实验。
2025年10月,华中农业大学宋波涛课题组联合华南农业大学陈琳课题组在Plant Physiology杂志上发表了一篇题为“Natural allelic variation in the CBF2 transcription factor is a pivotal factor controlling cold resistance in potato”的研究论文。作者对来源于52个不同品种马铃薯CBF2的同源基因进行了系统发育分析,结合耐寒性已知的马铃薯品种系统发育关系及数据,初步认定CBF2位点“A”的变异与马铃薯的耐寒性表现出极强的相关性,具体来说,含有丝氨酸-脯氨酸(Ser-Pro)序列的第四种变异类型(Type 4)与高耐寒性显著关联,而缺失该位点或被亮氨酸(Leu)取代的第二、三种变异类型(Type 2/3)则与低温敏感性相关(图1)。因此作者选择了分别来自抗寒野生种Solanum commersonii的CBF2(命名为ScCBF2,属于Type 4)和来自不抗寒栽培种Solanum tuberosum的CBF2(命名为StCBF2,属于Type 2)进行深入的功能验证。
与上篇文献类似,作者同样分析了蛋白结构差异、过表达株系的表型及转录组测序分析差异表达模式。不同的是,该文献研究的是转录因子,因此作者着重研究了CBF2调控的下游靶基因,分别通过EMSA实验、Dual-LUC实验及蛋白-DNA分子对接,证明了ScCBF2、StCBF2、ScCBF2m(A位点功能缺失突变体)、StCBF2m(A位点功能获得突变体)对同一下游靶基因存在不同的调控能力及结合亲和力。最终证明CBF2的A位点的自然变异诱导ScCBF2和StCBF2的结构发生变化,从而影响它们对GolS3启动子的转录激活。这种机制导致ScCBF2过表达植株中棉子糖含量显著增加,而StCBF2过表达植株中棉子糖含量保持不变,从而造成耐寒性的差异。

图3 ScCBF2和StCBF2在响应冷胁迫中的作用模型(Chen et al., 2025)。蓝色斑点代表ScCBF2蛋白,红色斑点代表StCBF2蛋白,后者在A位点相对于ScCBF2蛋白缺少氨基酸。深黄色和浅黄色斑点分别对应于ScGolS3和StGolS3蛋白。橙色椭圆代表棉子糖,椭圆的大小与棉子糖的含量成正比。实线表示已确定的相互作用。
02
启动子突变
启动子是位于基因转录起始位点上游的一段非编码DNA序列,是RNA聚合酶及转录因子结合的关键区域,在基因表达调控中起重要作用。启动子上顺式作用元件的种类和数量不同,是导致基因时空表达特异性的原因之一。因此可以通过双荧光素酶报告系统、GUS染色和RT-qPCR等手段比较突变前后的启动子活性和转录水平。还可以尝试构建互换启动子的过表达载体,进行遗传转化,观察植株表型及生理指标变化。若突变位点位于关键顺式作用元件附近,还可以进一步验证是否影响上游转录因子的结合。如果目标物种的基因编辑效率较高,也可以尝试定点编辑启动子区域,创制突变植株来验证调控机制。小远在前期的推文“植物诱导型启动子大盘点(一)、(二)、(三)”给大家整理了不同类型的启动子,感兴趣的话,可以进行阅读哦~
2024年6月,山东农业大学陈雪森课题组在Advanced Science杂志上发表的一篇题为“A Functional InDel in the WRKY10 Promoter Controls the Degree of Flesh Red Pigmentation in Apple”的研究论文,作者通过分析红肉和非红肉苹果的基因组结构变异,发现红肉苹果中WRKY10的启动子区域存在163bp的缺失,并将其命名为R-InD。作者构建了不同类型启动子驱动MdWRKY10-GFP的融合表达载体:含有R-InD(R-InD::MdWRKY10)、不含R-InD(Def::MdWRKY10)、3×R-InD(3×R-InD::MdWRKY10)、CaMV35S(35S::MdWRKY10),并瞬时转化苹果愈伤组织和苹果果实,通过Western blot检测MdWRKY10-GFP表达量、观察转基因愈伤组织表型并检测花青素含量以及GUS染色实验,表明R-InD影响MdWRKY10的转录激活(图4)。

图4 R-InD序列对MdWRKY10启动子转录激活的功能分析(Wang et al., 2024)。(A)野生型“Orin”愈伤组织和转基因愈伤组织的表型;(B)通过GFP抗体,WB检测证实转基因愈伤组织中转基因的存在;(C)野生型和转基因愈伤组织中MdWRKY10的转录水平;(D)野生型和转基因愈伤组织中的花青素含量;(E)瞬时转化苹果果肉的表型;(F)瞬时转化苹果果实中MdWRKY10的转录水平。(G)瞬时转化苹果果实中花青素的含量;(H)GUS染色实验分析启动子活性;(I)转化苹果愈伤组织中GUS基因的转录水平。
2025年3月,安徽农业大学夏恩华课题组在The Plant Journal杂志上发表了一篇题为“Natural variation in promoters of F3'5'H and ANS correlates with catechins diversification in Thea species of genus Camellia”的研究论文,作者通过代谢组学和转录组学分析了不同品种茶树中儿茶素的含量及差异表达基因,发现相比栽培茶树,四球茶树中EGCG(表没食子儿茶素没食子酸酯 )的积累量极低,类黄酮3,5-羟化酶(F3'5'H)的表达与茶属植物中EGCG的积累高度相关。随后作者分别克隆了舒茶早(栽培茶树)和四球茶树中F3'5'H的编码区和启动子区序列,发现编码区高度保守,但四球茶树的启动子区存在14bp的缺失(图5a)。作者删除舒茶早F3'5'H启动子中的14bp片段,同时将该14bp片段回补到四球茶树F3'5'H启动子中,进行了启动子活性分析、Y1H、Dual-LUC、EMSA实验,实验结果表明四球茶树启动子中的14bp缺失破坏CsMYB1对F3'5'H的转录激活,导致四球茶树中EGCG积累量降低(图5b-f)。

图5 四球茶树(C. tetracocca)启动子中14bp缺失的功能验证(Zhang et al., 2025)。(a)野生茶树近缘种和栽培品种中F3'5'H启动子序列的比对;(b)Y1H实验表明MYB1无法与四球茶树(SQ)F3'5'H启动子结合;(c)舒茶早和四球茶树中F3'5'H启动子重构示意图;(d)Dual-LUC实验表明MYB1可以一定程度上激活四球茶树F3'5'H的启动子,但其激活作用弱于舒早茶F3'5'H的启动子;(e)Dual-LUC实验表明,14bp序列改变MYB1对F3'5'H的激活作用;(f)对应于e图的荧光值测定。
03
内含子突变
内含子在基因转录过程中被剪切去除,不直接参与编码蛋白质,因此常常被认为是无用序列。但近年来的一些研究表明,内含子在转录调控、mRNA剪接效率、核输出、翻译效率以及基因进化等方面发挥重要作用。例如:内含子可通过影响基因的选择性剪切使一个基因产生多个不同的转录本,从而提高蛋白翻译的多样性,关于基因的选择性剪切可查看小远往期文章“植物基因的“断舍离”——选择性剪接”;部分内含子中存在顺式作用元件和调控因子的结合位点,从而影响启动子活性和基因的时空表达;此外内含子中还可以作为非编码RNA的来源。因此,可以通过全转录组测序和RT-qPCR分析可变剪接事件;通过报告基因系统分析其对转录活性的影响。
2023年11月,中国农业大学韩振海课题组联合吴婷课题组在Nature Communications杂志上发表一篇题为“Pan-genome analysis of 13 Malus accessions reveals structural and sequence variations associated with fruit traits”的研究论文,作者对多个苹果果实性状进行了结构变异的全基因组关联分析(SV-GAWAS)结合文献报道,鉴定出了苹果果皮着色相关的SV:激酶MMK2(GS07G0097300)。对24个具有不同果皮颜色表型的品种的MdMMK2位点进行了等位基因分型,发现在果皮不着色的种质资源中激酶MMK2的第四个内含子中存在209bp的插入(LTR/Gypsy TE)(图6a、e)。随后为了测定内含子mRNA水平,从苹果皮cDNA中克隆了第四个内含子序列,发现MdMMK2的第四个内含子在有色和无色品种中均可扩增并表达(图6f),推测该区域可能作为非编码RNA(ncRNA)影响MKK2的表达。为了验证这一观点,分别构建了LTR/Gypsy TE插入(MMK2-In4+)、未插入(MMK2-In4)的表达载体,在烟草叶片中进行了荧光素酶互补成像实验,发现第四个内含子中LTR/Gypsy TE的插入抑制MdMMK2的转录(图6g-j)。

图6 MdMKK2第四个内含子中LTR/Gypsy TE的插入抑制MdMMK2的转录(Wang et al., 2023)。(a)影响有色和无色苹果品种中MMK2基因的示意图;(b)MdMMK在苹果愈伤组织中的过表达;(c)转基因苹果愈伤组织的花青素含量;(d)RT-qPCR分析检测苹果愈伤组织中MdMMK2的相对表达水平;(e)24个品种中MdMMK2的基因型鉴定;(f)MdMMK2第四个内含子的转录状态鉴定。以未逆转录的RNA为模板进行标准PCR反应作为对照,未出现条带表明没有基因组DNA残留。最后四泳道显示以苹果皮cDNA为模板;(g)插入(MMK2-In4+)或未插入(MMK2-In4)的MdMMK2第四内含子的示意图;(h)表达MMK2-In4、MMK2-In4+的效应构建体以及包含MdMMK2的报告载体的示意图;(i)荧光素互补成像实验验证MMK2的转录激活;(j)不同共浸润组合的LUC/REN比值分析。
04
UTR突变
UTR是指位于mRNA两端的非编码序列,分为5' UTR和3' UTR,包含着丰富的调控元件,UTR突变可以通过一系列相互关联的过程改变基因表达,包括转录、剪接、mRNA稳定性以及蛋白质翻译。因此,可以通过RT-qPCR检测突变对转录水平和mRNA稳定性的影响;通过双荧光素酶报告基因、融合蛋白表达或Ribo-seq等手段比较突变前后翻译效率差异;另外若UTR突变区域存在一些miRNA结合位点,则可以检测突变前后的结合能力差异。同样也可以分析突变前后转基因植株的表型。关于UTR在基因表达调控中的重要作用大家可以查看“UTR中不可小觑的调控元件”。
2022年9月,康涅狄格大学袁耀武课题组在Science Advances杂志上发表了一篇题为“Lost in translation: Molecular basis ofreduced flower coloration in a self-pollinated monkeyflower (Mimulus) species”的研究论文,作者构建了猴面花的近等基因系(NILs)并通过全基因组测序技术鉴定出一个与花瓣颜色相关的337kb的区域,该区域包含一个花青素激活的R2R3-MYB转录因子——PETAL LOBE ANTHOCYANIN(PELAN)。但由于没有进行更进一步的精细定位,因此分别检测了PELAN在不同品种猴面花中转录水平的表达量,同时比对了氨基酸序列差异、差异氨基酸序列异源过表达烟草后的花青素积累及稳定转化浅色猴面花的表型,发现基因的转录和氨基酸序列差异均不是花瓣颜色深浅的原因(图7A-C)。由于5'和3' UTR通常在蛋白质的翻译中发挥关键作用,作者比较了四个物种的UTR序列,发现MpPELAN基因上游的一个单核苷酸突变(G->T)可产生新的ATG起始,并引起移码突变(图7D)。在M. parishii中过表达含上游序列的MpPELAN并不能使花呈深粉红色;如果将该突变位点T重新变为G后过表达,则又可使花瓣呈深粉红(图7E)。
随后作者构建了4个不同的YFP-HA报告基因载体:(1)包含野生型MpPELAN等位基因的整个移码的uORF(35S:uATG_OUT_ATG_YFP-HA);(2)将(1)中uATG变为AGG(35S:AGG_OUT_ATG_YFP-HA);(3)将uATG和正常的ATG置于同一阅读框内,两者之间由30bp的间隔序列隔开(35S:uATG_IN_ATG_YFP-HA);(4)将(3)中uATG变为AG(35S:AGG_IN_ATG_YFP-HA)。瞬时转化烟草叶片后通过激光共聚焦、Western blot分别检测YFP和HA的表达量,结果表明uATG抑制蛋白的翻译(图8)。以上结果说明MpPELAN基因上G->T突变可产生的uATG抑制蛋白翻译。

图7 PELAN的5' UTR中的单个核苷酸替换是M. parishii和M. cardinalis花瓣颜色深浅的根本原因(Liang et al., 2022)。(A)通过对花瓣裂片(开花前1天)进行qRT-PCR检测,测定PELAN转录本的相对水平;(B)烟草叶片中MpPELAN和McPELA的瞬时表达分析;(C)在M. parishii中稳定过表达MpPELAN和McPELAN的表型;(D)序列比对显示正常的ATG起始密码子(在所有四个物种中都是保守的)和M. parishii由于G->T突变而特有的uATG。uORF的11个密码子(包括终止密码子)以洋红色突出显示;(E)突变型MpPELAN等位基因(uATG突变回AGG)可以恢复M. parishii中的花青素积累,而野生型MpPELAN等位基因则不能。

图8 MpPELAN 5' UTR中的uATG抑制蛋白质翻译(Liang et al., 2022)。(A、B)载体构建示意图;(C、D)在烟草叶片中瞬时表达35S:uATG_OUT_ATG_YFP-HA和35S:AGG_OUT_ATG_YFP-HA的YFP荧光和YFP-HA蛋白表达量;(E、F)在烟草叶片中瞬时表达35S:uATG_IN_ATG_YFP-HA和35S:AGG_IN_ATG_YFP-HA的YFP荧光和YFP-HA的蛋白表达量。
05
多区域同时突变
前面小远给大家介绍的文献案列基本都是单一区域存在变异,此种情况下作者不必困扰于表型差异到底因何而起,直接针对突变区进行进一步验证即可。但探索的过程中难免会碰到一个基因同时存在多个区域的突变,那么此时该如何抉择呢?
2025年7月,中国农业科学杨学勇课题组、黄三文课题组联合英国约翰英纳斯中心丁一倞课题组在Cell杂志上发表了一篇题为“Recessive epistasis of a synonymous mutation confers cucumber domestication through epitranscriptomic regulation”的研究论文,作者发现黄瓜果实长度由两个紧密连锁的QTL(FL1.1和FL1.2)共同决定,且当FL1.2为栽培等位基因时,无论FL1.1的基因型是什么,果实始终是长瓜。通过图位克隆和基因组测序,发现FL1.2位点存在一个乙烯合成限速酶基因ACS2,且在野生型黄瓜(C. sativus var. hardwickii PI183967,果实短而圆)和栽培黄瓜(C. sativus cv. Xintaimici,果实典型的长形)中,ACS2存在3个外显子的同义突变、2个内含子突变及一个5' UTR区域的3碱基Indel。通过全长转录组测序、RNA-seq、RT-qPCR分析发现上述变异不影响RNA剪切和选择性表达,但FL1.1W FL1.2W中的ACS2蛋白水平明显高于FL1.1W FL1.2C植物(图9A、B)(PS:W和C分别代表野生型和栽培型等位基因),基于此排除了内含子区域突变。随后作者通过Dual-LUC实验进行了翻译活性分析,发现ACS2W CDS的构建体中FLuc/RLuc活性显著增加,且含有ACS2W CDS的第三个同义SNP C1287的构建体表现出更高的FLuc/RLuc活性,而含有ACS2W 5' UTR的构建体则未观察到任何影响,基于此排除了5' UTR区域突变并确定外显子1287位置C>T同义突变影响ACS的蛋白翻译水平(图9C、D)。通过CBE单碱基编辑系统,作者将包含2kb自身启动子以及ACS2全长CDS(仅在1287位点存在一个同义变体)的1287C和1287T构建体分别转化到FL1.1W、FL1.2C和FL1.1C、FL1.2C植株中,发现C到T的转换均显著降低了ACS2蛋白的丰度并促进了果实伸长(图9E-H),证实了双荧光素酶的结果。此外该研究也是首次在遗传上证实了同义突变可通过调控m6A修饰和mRNA结构构象来影响作物驯化中的重要农艺性状,打破了一贯的同义突变通常不影响基因功能的论述。在这里小远为了契合本次文章的主题介绍的比较简单,感兴趣的小伙伴可以自行下载仔细阅读哦~

图9 ACS2基因中的同义突变影响其功能(Xin et al., 2025)。(A)FL1.2精细定位区间包含ACS2基因。上图:选定重组体的基因型和果实长度,灰色和紫色分别代表新泰密刺(Xintaimici)和哈氏(hardwickii)基因型。下图:ACS2W和ACS2C基因结构及其变体的示意图。方框、线条和灰色方框分别代表外显子、内含子和UTR;(B)免疫印迹分析显示早期果实发育过程中ACS2蛋白水平;(C)利用双荧光素酶报告基因对ACS2的5' UTR或CDS变异进行功能鉴定。左图展示了ACS2W和ACS2C中所有5' UTR和CDS变异组合的构建体,中图左侧显示了相应构建体的FLuc/RLuc活性,右图显示了相应构建体的ACS2 mRNA相对表达水平;(D)利用双荧光素酶报告基因对三个同义SNP进行功能鉴定。左图展示了ACS2W和ACS2C中三个同义SNP不同组合的构建体,三个点代表三个同义SNP,中图左侧显示了相应构建体的FLuc/RLuc活性,右图显示了不同构建体的ACS2 mRNA相对表达水平;(E)ACS21287C的碱基编辑结果;(F、G)C1287到T转变的转基因植物的果实表型;(H)与(F)和(G)相关的果实长度和ACS2蛋白水平的定量分析。
文章至此就结束了,通过该篇文章相信大家也发现,其实用到的实验方法,和我们正常研究一个基因功能基本一致,关键在于如何去设计实验。方法均是小远通过阅读文献总结而来,也许会存在考虑不周的地方,如果有其他的研究思路方法欢迎留言告诉小远一起完善~
References:
Qu Z, Tian Z, Wei L, et al. A chaperonin BnaC01. CCT8 contributes to silique length and seed weight by affecting auxin and jasmonic acid signalling in Brassica napus[J]. Plant Biotechnology Journal, 2025, 23(9): 3934-3948.
Chen Y, Chu Y, Wang J, et al. Natural allelic variation in the CBF2 transcription factor is a pivotal factor controlling cold resistance in potato[J]. Plant Physiology, 2025, 199(2): kiaf428.
Wang N, Liu W, Mei Z, et al. A functional InDel in the WRKY10 promoter controls the degree of flesh red pigmentation in apple[J]. Advanced Science, 2024, 11(30): 2400998.
Zhang Y, Pan H, Wu Q, et al. Natural variation in promoters of F3′ 5′ H and ANS correlates with catechins diversification in Thea species of genus Camellia[J]. The Plant Journal, 2025, 121(6): e70108.
Wang T, Duan S, Xu C, et al. Pan-genome analysis of 13 Malus accessions reveals structural and sequence variations associated with fruit traits[J]. Nature Communications, 2023, 14(1): 7377.
Liang M, Foster C E, Yuan Y W. Lost in translation: molecular basis of reduced flower coloration in a self-pollinated monkeyflower (Mimulus) species[J]. Science advances, 2022, 8(37): eabo1113.
Xin T, Zhang Z, Zhang Y, et al. Recessive epistasis of a synonymous mutation confers cucumber domestication through epitranscriptomic regulation[J]. Cell, 2025.
基因不同位点突变解析策略

被折叠的 条评论
为什么被折叠?



