前言介绍:
1.结合MutationalPatterns和deconstructSigs两个包讲述详细
MutationalPatterns包,表述清晰
deconstructSigs|探寻cosmic的独特“气质“mutation signature
用deconstructSigs来做cosmic的mutation signature图
deconstructSigs与MutationalPatterns包融合绘图
2.SCI 文章中基因组的突变信号(maftools):与SBS数据库对比
w=lapply(unique(x$Sample) , function(i){
sample_1 = whichSignatures(tumor.ref = sigs.input[,],
signatures.ref = signatures.exome.cosmic.v3.may2019, ## signatures.cosmic signatures.nature2013
sample.id = i,
contexts.needed = TRUE,
tri.counts.method = 'default')
# print(i)
# p <- plotSignatures(sample_1)
return(sample_1$weights)
})
上述代码中 “signatures.cosmic ”,“signatures.nature2013”,“signatures.exome.cosmic.v3.may2019”均可以找到,进而可以替换为自定义:查看cosmic的30个signature的96突变频谱;“signatures.exome.cosmic.v3.may2019” bing搜一下就有
3. 分析需求:
理解的分析步骤:
- SigminerR包 生成突变上下文: 基于六种碱基替换 (C>A, C>T, C>G, T>A, T>G, T>C) 生成 96个突变contexts。每个contexts由突变碱基及其前后两个碱基组成。例如,“C>A” 突变,后一个碱基为 T,则对应的上下文为 “GCT>GAT”。
- 使用 SignatureAnalyzer 进行 NMF 分析: 将 96 个突变上下文作为输入数据,使用
SignatureAnalyzer 进行非负矩阵分解 (NMF) 分析。SignatureAnalyzer 使用贝叶斯变体来进行 NMF分析,并自动推断最佳的特征数量。 - 与 COSMIC 数据库比较: 将 SignatureAnalyzer 识别的每个特征配置文件与 COSMIC 数据库中的已验证的癌症特征进行比较,使用余弦相似度分析来找到最佳匹配。余弦相似度值范围从 0 到1,代表从最大差异到最大相似。
分步执行:
使用 sigminer 进行突变模式分析: https://shixiangwang.github.io/home/cn/post/2020-06-07-mutational-signature-analysis-with-sigminer/
library(maftools)
library(sigminer)
library(NMF)
## 生成96 contexts
maf <- read.maf("data/all_sample.maf")
mt_tally <- sig_tally(
maf,
ref_genome = "BSgenome.Hsapiens.UCSC.hg19",
useSyn = TRUE,
mode = "ALL"
)
show_catalogue(mt_tally$SBS_96 %>% t(), mode = "SBS", style = "cosmic")
## 确定提取多少个 Signatures
est <- sig_estimate(mt_tally$SBS_96, range = 2:5, nrun = 50, verbose = TRUE)
show_sig_number_survey2(est$survey)
context <- mt_tally[["SBS_96"]]
write.table(context,file = paste0(respath,"3_cosmic/96context.txt"),quote = F,col.names = T,row.names = T)