IF 6+ 8种机器学习算法构建HCC预后模型赠送代码

图片

这期分享一篇2024年9月发表在 6.8/Q1 NPJ Precision Oncology 的文章 Immune-related cell death index and its application for hepatocellular carcinoma,免疫相关细胞死亡指数及其在肝癌中的应用。

摘  要

调节细胞死亡(RCD)在肝细胞癌(HCC)的免疫微环境、发展和进展中起着至关重要的作用。然而,可靠的免疫相关细胞死亡信号尚未被探索。在本研究中,我们收集了12种RCD模式(如凋亡、铁ptosis和铜protosis),包括1078个调节因子,基于HCC免疫亚群鉴定免疫相关的细胞死亡基因。使用开发的竞争性机器学习框架,筛选9个基因以构建免疫相关细胞死亡指数(IRCDI),该指数可用于在线申请。通过分析多组学数据及临床特征,探讨HCC的恶性异质性。为了验证该模型的有效性,使用了超过18个独立队列,包括生存和多样化治疗队列和数据集。这些发现通过内部样品和分子生物学实验得到了进一步的验证。总的来说,IRCDI可能在HCC患者的个体治疗决策和改善预后方面有广泛的应用。

d03d288714f318f4b320af9d9c378d4c.png

生信分析流程

数据集选择

转录组数据:

8 survival datasets (TCGA-LIHC, ICGC-LIR1, GSE54236, GSE14520, TCGA-PAAD, TCGA-STAD, TCGA-ESCA, and TCGA-COAD),

one large transcriptome dataset (GSE25097)

免疫数据

GSE100797, IMvigor 210 cohort, GSE35640, and GSE91061

TACE治疗数据集

GSE104580

蛋白质组学数据

In-house HCC cohort

单细胞数据

GSE149614

细胞学数据

3 HCC cell lines datasets.

实验方法

qRT-PCR

LC–MS/MS analysis

基因集选择

12种细胞死亡模式1078个调控因子

实验方法

qRT-PCR

生信分析方法

根据文章的分析流程提取所有的分析内容,整理出来就9个分析条目,每个条目都包括分析的内容,这些分析构成了整个文章,本文基于全长转录组文章,下面我们就看看哪些分析可以利用桓峰基因公众号的教程来实现,点击分析条码就会跳转到对应公众号的教程,跟着教程做,您也能发轻松发高分,如下:

数据处理教程

1. TCGAbiolink

2. cBioProtal

3. GEOquery

转录组分析教程

1. 基因差异表达分析(Limma);

2. 单因素Cox回归分析(survival);

3. 多变量Cox回归分析筛选基因(survival);

4. 基因功能分析(clusterProfiler);

5. 基因集富集分析(GSEA);

6. 单样本基因集富集分析(ssGSEA);

7. 生存分析(Kaplan-Meier);

8. 功能来识别HCC中不同的免疫亚群(consensusClusterPlus)

9. 标记IRCDGs的染色体位置(circlize)

10. 蛋白-蛋白相互作用分析(PPI)

11. 加权相关网络分析探讨IRCDI共表达基因(WGCNA)

基因组变异分析教程

1. 突变-等位基因肿瘤异质性(maftools)

免疫微环境分析

1. 计算基质细胞和免疫细胞的丰度(ESTIMATE);

2. 定量22种免疫细胞的浸润情况(CIBERSORT);

3. 反褶积揭示肿瘤免疫结构的分子和药理学(quanTIseq);

4. 基于转录组计算肿瘤免疫浸润得分(xCell);

5. 估计组织浸润免疫细胞和基质细胞群的群体丰度(MCP-counter);

6. 基于TCGA的免疫浸润细胞分析(TIMER)

药物敏感性分析

1. 预测肝癌患者化疗敏感性(oncoPredict);

免疫治疗反应预测

  1. 评估肿瘤样本基因表达谱中肿瘤免疫逃避的可能性(TIDE);

探索潜在的治疗药物

8种机器学习算法

步骤1:单因素Cox回归

首先通过单因素Cox回归分析确定各IRCDG的风险比(HR)和95%置信区间(CIs),其中p值小于0.05的基因视为预后基因。

步骤2:最小绝对收缩和选择算子(LASSO) Cox回归

为了避免过拟合,使用LASSO Cox回归,使用“glmnet”软件包减少候选基因的数量。那些留在模型中的基因具有最小的lambda值。

步骤3:竞争性机器学习框架

1. Least Absolute Shrinkage and Selection Operator Regression Algorithm (Lasso)

2. Stepwise Cox Proportional Hazards Regression Algorithm (stepwiseCox)

3. CoxBoost Algorithm (CoxBoost)

4. Random Survival Forest Algorithm (RSF)

5. Elastic Net Regression Algorithm (Enet)

6. Partial Least Squares Regression To Cox Models Algorithm (plsRcox)

7. Supervised Principal Components for regression Algorithm (SuperPC)

8. Gradient Boosting Machine Algorithm (GBM)

9. Survival support vector machines Algorithm (survival-SVM)

构建列线表

采用单因素和多因素Cox回归分析评价不同临床病理因素与OS的相关性

1. 构建nomogram(RMS);

2. 1年、2年和3年生存率的预后校准曲线(RMS);

3. 评价敏感性和特异性(timeROC);

4. 使用Wilcoxon秩和检验对连续变量进行分析;

5. 分类变量采用卡方检验进行统计学比较;

6. c指数评价模型的预测能力;

7. 动态图是使用“shinyPredict”R包构建的,然后作为web应用程序部署到服务器上

R语言绘图教程

1. 散点图 (Scatter)

2. 柱状图 (Barplot)

3. 箱线图 (Boxplot)

4. 折线图 (Lineplot)

5. 饼图 (Pieplot)

6. 韦恩图 (Vennplot)

7. 直方图 (HistogramPlot)

8. 小提琴图 (ViolinPlot)

9. 相关性矩阵图(Correlation Matrix)

10. 主成分绘图(pca3d)

11. 绘制误差线 (Errorbar)

研究结果

HCC中两种不同免疫亚群的鉴定和验证

a 聚类热图显示HCC样本与两个亚组的一致评分。

b 采用共识法和M3C聚类法对患者进行分类。

c 具有所有亚组数的CDF曲线。

d 模糊聚类(PAC)得分表示最优数k的比例为2。

e 热图显示了用ssGSEA方法计算的28个免疫细胞在两种不同免疫亚型中的丰度。

f-i 热图和PCA图显示了独立队列中免疫亚群的IRCDGs表达模式和分布。

j 在TCGA-LIHC队列中发表的四项研究中的冷免疫和热免疫亚型。

078cd3ef06e9bc686b97aecbe6bdfe97.png

免疫相关细胞死亡基因(IRCDGs)的基因组学和功能特征

a IRCDGs包含来自7种细胞死亡模式的108个调节因子。

b 基于metscape的IRCDGs功能通路网络。

c 面板图显示基因组突变类型的频率汇总。

d 瀑布图显示HCC患者中前20个突变的IRCDGs。

c60d637ef516fce43644c8de2c721d70.png

通过开发竞争性机器学习框架构建免疫相关细胞死亡指数(IRDCI)

a 开发IRCDI的竞争性机器学习框架。

b 经单因素Cox分析,29个生存相关基因的HR为95% CIs。

c-d 根据最小lambda确定最优变量。

e 采用StepCox模型确定9个模式基因的系数。

f 组合热图显示了每个数据集中每种机器学习方法的c指数。

g 已开发的IRCDI在线网站截图。

h 热图显示IRCDI与模型基因临床特征的关系。

6489db0b84cbf3a86936c6716aa1d7fd.png

IRCDI的临床特征、相关性及预后预测

a-j 分别为性别、年龄、分级、残留肿瘤、AFP、OS、分期、pT、pN、pM的箱形图。

k TCGA-LIHC OS的IRCDI生存曲线和多变量Cox回归结果的森林图。

l TCGA-LIHC RFS的IRCDI生存曲线和多变量Cox回归结果的森林图)。

m-p 分别为LIGC-LIRI操作系统、GSE54236操作系统、GSE14520操作系统和GSE14520 RFS的IRCDI生存曲线。

q-t TCGA-PAAD、TCGA-STAD、TCGA-ESCA、TCGA-COAD各组IRCDI生存曲线。

9023454c1f34aac0e49279532ba028b1.png

IRCDI亚群中不同的驱动基因和生物学途径

a-b 基于TCGA-LIHC队列的IRCDI亚组前10个突变基因。

c 棒棒糖图显示了IRCDI亚组中TP53基因突变的位点和类型。

d 生存曲线显示基于IRCDI和TP53突变状态的不同风险层。

e 棒棒糖图显示了CTNNB1基因在IRCDI亚组中的突变位点和突变类型。

f 生存曲线显示基于IRCDI和CTNNB1突变状态的不同风险层。

g 基因集富集分析(GSEA)显示了IRCDI亚组中上调和下调的途径。

h 散点图显示了与IRCDI相关的最显著的活性通路。

i-j 箱形图显示了代表性通路的差异。

k 基于WCGNA分析模块基因与IRCDI及临床特征的关系。

l 绿松石和绿色模块基因的途径富集分析。

d7d066dda24b919da4d3ef9e1feab7ad.png

免疫细胞浸润和PD-1与IRCDI的关系

a UMAP分析显示已识别的细胞类型。

b-c IRCDI在不同细胞类型中的分布。

d Boxplot显示实验免疫亚型中IRCDI水平的差异。

e 免疫细胞浸润在IRCDI亚群中的作用。

f-h 散点图显示了活化CD8 T细胞、效应记忆CD8 T细胞和1T辅助细胞之间的负相关关系。

i 基于蛋白质组学的CD8A与IRCDI关系条形图。

j-m 在TCGA-LIHC、ICGC-LIRI、GSE14520和GSE54236数据集中PD-1表达与IRCDI呈负相关的箱线图。

n 免疫组化实验验证PD-1表达与IRCDI的关联。

f53f17690fa1fb25052174703268805e.png

IRCDI的治疗反应表现

a 治疗预测流程图。

b 箱线图显示了IRCDI亚组的TIDE评分差异。散点图显示了IRCDI和TIDE评分之间的线性关系。

c-d 在GSE100797和IMvigor 210队列中,ICB治疗下IRCDI的总生存曲线。

e Box图和ROC曲线分别显示了IRCDI和PD-1在GSE35640中对anti-MAGE-A3反应的预测效果。

f 箱形图和ROC曲线分别显示了IRCDI和PD-1在GSE91061中抗PD-1/CTLA-4应答预测的性能。

g 箱形图和ROC曲线分别显示了IRCDI和PD-1在GSE10458中TACE反应预测的性能。

21182947a824b8cb930b576eba2f5aa5.png

FDA根据IRCDI批准的常用药物选择

a 药物选择流程图。

b Spearman分析显示IRCDI耐药和敏感药物前10名。

c 维恩图显示药物预测结果与GDSC记录的重叠。

d Venn图显示药物预测结果与GDSC记录的重叠。

e 用IRCDI对各HCC细胞系中溴化苯醚的IC50值排序。

f-g 显示BIRC5在IRCDI亚组中的表达水平和预测的分离溴化铵IC50的箱线图。

h BIRC5在TCGA-LIHC队列中的生存曲线。

i 散点图分别显示了IRCDI与药物和靶基因的预测IC50之间的关系。

j 根据Autodock结果,三维结构显示了所选药物与靶点的结合模式。

1f8b46e9e1d28c2b7ed4c231e3b5f6a8.png

9个基因panel的实验探索

a 验证实验流程图。

b QRT-PCR结果显示ACSL6在正常组织和癌组织中的表达差异。

c 来自HPA数据库的IHC结果。

d 条形图显示对照和Si-ACSL6 HepG2细胞株中ACSL6 mRNA的相对水平。

e 对照和Si-ACSL6 HepG2细胞株细胞增殖曲线。

f 柱状图显示对照和Si-ACSL6 Huh7细胞系中ACSL6 mRNA的相对水平。

g 对照和Si-ACSL6 Huh7细胞株细胞增殖曲线。

h-i 对照和Si-ACSL6 HepG2细胞株创面愈合实验结果。

j-k 对照和Si-ACSL6 Huh7细胞株伤口愈合试验结果。

l 对照和Si-ACSL6 HepG2细胞株蛋白质组学分析不同表达基因的途径富集结果。

1f27807f7085ec8ba0b9a14d9ddc7736.png

Reference

Sun, Z., Liu, H., Zhao, Q. et al. Immune-related cell death index and its application for hepatocellular carcinoma. npj Precis. Onc. 8, 194 (2024).

关注桓峰基因公众号,发消息“IRCDI”,即可获得下载链接。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值