
关键词:小麦;分子育种;生信分析;
引言
普通小麦(AABBDD)源于7000-8000年前中东地区四倍体小麦与粗山羊草的自然杂交。约3500-4000年前传入中国,逐渐成为华北主要农作物。
自1950年以来,我国共育成审定约3500个小麦新品种。多样化的生态类型(如春性与冬性、雨养与灌溉、单季与双季)和复杂的饮食文化需求,共同驱动了中国小麦遗传多样性的形成与演变。
研究团队选取17个具有代表性的品种进行基因组测序,结合现有的泛基因组资源,识别出大量结构变异。在基因数据分析过程中,研究团队使用Sentieon DNAseq进行变异检测,大幅提升了大数据分析的准确性和效率。
分析显示欧洲种质在中国现代小麦育种中的整合过程,以及VRN-A1等重要基因的进化特征。在CM42中发现的外源片段和1RS·1BL易位体中pSc200的显著减少,反映了小麦基因组的持续进化。

本周的Sentieon文献解读专栏给大家带来一篇被引用高达50次的佳作:“Pan-genome bridges wheat structural variations with habitat and breeding”,该文章于2024年在《Article》发表,由中国农业科学院作物科学研究所联合南京农业大学、澳大利亚莫道克大学等机构共同完成。
解读文章,给做进化育种的老师学生们一些参考。
材料与方法学
研究材料
17个品种:BJ8、MZM、XN6028、Abo、NC4、YM158、XY6、AMN、JM47、S4185、CM42、JM22、KF11、ZM366、ZM16、ZM22、HD6172;
研究方法
基因组测序与组装方法
研究团队首先使用PacBio Sequel II平台对17个小麦品种进行长读长测序,构建15-kb SMRT Bell文库,平均深度为30.37X。并利用Hi-C技术对交联的染色质进行DpnII酶切、生物素标记和连接并建库,使用Illumina NovaSeq 6000进行双端测序,平均深度为63.82X。
在基因组组装过程中,使用Hifiasm进行contig组装,结合ALLHiC和Hi-C数据聚类,用Juicebox进行人工校正。
转录组分析与基因注释
转录组分析涵盖四个品种(XY6、AMN、JM22、ZM16)的8个组织,使用DNBSEQ-T7进行测序,每个样本获得约10 Gb数据。并进行PacBio Iso-seq测序,构建0-5 kb插入文库,在Sequel II上获得超过10 Gb的测序数据。
基因注释过程包括三个主要方面:重复序列注释、基因结构预测和功能注释。重复序列注释整合了ClariTeRep和TREP-DB数据库,使用RepeatMasker和Tandem Repeats Finder进行分析。基因结构预测则综合了同源预测、从头预测和转录本证据,通过EvidenceModeler进行整合。功能注释通过比对NCBI-NR等五大数据库完成,并使用InterProScan进行蛋白结构域和GO注释。
变异检测与群体分析
变异检测包括SNP/InDel和结构变异(SV)的鉴定。SNP/InDel鉴定使用BWA-MEM进行比对,经过SAMtools去除重复,使用Sentieon DNAseq进行变异检测,由GATK进行过滤。使用MUMmer和SyRI进行SV鉴定。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



