今天给同学们分享一篇实验文章“Comprehensive analysis of mutational signatures reveals distinct patterns and molecular processes across 27 pediatric cancers”,这篇文章发表在Nat Cancer期刊上,影响因子为22.7。
结果解读:
27种儿童癌症的体细胞突变频率
从作者先前发表的研究中收集了785个全基因组测序的肿瘤-正常对的数据集(PedPanCan队列,PPC-WGS,https://www.kitz-heidelberg.de/en/research/datacommons/pedpancan)和圣裘德儿童癌症基因组项目(https://www.stjude.org/research/translational-innovation/pediatric-cancer-genome-project.html),总共涵盖了27种分子定义的儿童癌症实体(图1a)。使用共识变异检测流程,包括更新的德国癌症研究中心(DKFZ)内部突变检测流程和mutect2(参考文献1),鉴定了SBS和IDs,大大提高了鉴定到的体细胞变异的质量(扩展数据图1a)。在整个队列中,作者总共鉴定到了2,834,456个SBS和252,722个IDs。每百万碱基对的SBS突变数量(中位数0.2350;范围0.0007-625.5)和IDs(中位数0.0036;范围0.00036-41.43)在个体肿瘤和不同癌症类型之间变化很大(图1a和附表1)。毛细胞星形细胞瘤的总体体细胞突变负担最低(中位数0.每百万碱基对的总突变数为0.34)最低,DLBLNOS(弥漫性大B细胞淋巴瘤,未特指)最高,每百万碱基对的中位数为1.83)。虽然每个肿瘤的插入缺失突变负担较低,但SBS和ID的数量在肿瘤间存在显著相关性(Spearman r = 0.91; 图1b)。如先前在不同癌症类型中描述的那样,SBS和ID的突变负担在这个儿童队列中也与年龄明显相关(扩展数据图1b)。少数(n = 3)被分类为高级别胶质瘤(HGG,K27wt)且具有DNA错配修复基因(MSH6,PMS2)的胚系变异的肿瘤表现出高突变表型,每百万碱基对的中位数为79.23(图1b)。
儿童癌症中的突变特征
为了提取在这个儿童全癌症队列中活跃的突变特征,作者生成了96上下文的SBS和83上下文的ID突变目录(图2a),并使用了基于不同NMF原理的两种广泛使用的方法SigProfiler和SignatureAnalyzer(以下简称SigAnalyzer)。此外,还实施了第三种非NMF方法,称为分层狄利克雷过程(HDP),用于识别白血病的ID特征。由于每个儿童肿瘤中双碱基替代(DBS)的数量非常低,作者只从SBS和ID中提取特征。由于SigProfiler参考特征在科学界被广泛使用(COSMIC v.3),这里概述了SigProfiler的结果,SigAnalyzer的结果在附录表2、3、4和5中呈现。