Sentieon项目文章 | 泛基因组揭示小麦结构变异与栖息地及育种的关联

关键词:小麦;分子育种;生信分析;


引言

普通小麦(AABBDD)源于7000-8000年前中东地区四倍体小麦与粗山羊草的自然杂交。约3500-4000年前传入中国,逐渐成为华北主要农作物。

自1950年以来,我国共育成审定约3500个小麦新品种。多样化的生态类型(如春性与冬性、雨养与灌溉、单季与双季)和复杂的饮食文化需求,共同驱动了中国小麦遗传多样性的形成与演变。

研究团队选取17个具有代表性的品种进行基因组测序,结合现有的泛基因组资源,识别出大量结构变异。在基因数据分析过程中,研究团队使用Sentieon DNAseq进行变异检测,大幅提升了大数据分析的准确性和效率。

分析显示欧洲种质在中国现代小麦育种中的整合过程,以及VRN-A1等重要基因的进化特征。在CM42中发现的外源片段和1RS·1BL易位体中pSc200的显著减少,反映了小麦基因组的持续进化。

本周的Sentieon文献解读专栏给大家带来一篇被引用高达50次的佳作:“Pan-genome bridges wheat structural variations with habitat and breeding”,该文章于2024年在《Article》发表,由中国农业科学院作物科学研究所联合南京农业大学、澳大利亚莫道克大学等机构共同完成。

解读文章,给做进化育种的老师学生们一些参考。


材料与方法学

研究材料

17个品种:BJ8、MZM、XN6028、Abo、NC4、YM158、XY6、AMN、JM47、S4185、CM42、JM22、KF11、ZM366、ZM16、ZM22、HD6172;

研究方法

基因组测序与组装方法

研究团队首先使用PacBio Sequel II平台对17个小麦品种进行长读长测序,构建15-kb SMRT Bell文库,平均深度为30.37X。并利用Hi-C技术对交联的染色质进行DpnII酶切、生物素标记和连接并建库,使用Illumina NovaSeq 6000进行双端测序,平均深度为63.82X。

在基因组组装过程中,使用Hifiasm进行contig组装,结合ALLHiC和Hi-C数据聚类,用Juicebox进行人工校正。

转录组分析与基因注释

转录组分析涵盖四个品种(XY6、AMN、JM22、ZM16)的8个组织,使用DNBSEQ-T7进行测序,每个样本获得约10 Gb数据。并进行PacBio Iso-seq测序,构建0-5 kb插入文库,在Sequel II上获得超过10 Gb的测序数据。

基因注释过程包括三个主要方面:重复序列注释、基因结构预测和功能注释。重复序列注释整合了ClariTeRep和TREP-DB数据库,使用RepeatMasker和Tandem Repeats Finder进行分析。基因结构预测则综合了同源预测、从头预测和转录本证据,通过EvidenceModeler进行整合。功能注释通过比对NCBI-NR等五大数据库完成,并使用InterProScan进行蛋白结构域和GO注释。

变异检测与群体分析

变异检测包括SNP/InDel和结构变异(SV)的鉴定。SNP/InDel鉴定使用BWA-MEM进行比对,经过SAMtools去除重复,使用Sentieon DNAseq进行变异检测,由GATK进行过滤。使用MUMmer和SyRI进行SV鉴定。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值