机器学习分析scRNA-seq解析急性髓系白血病中的疾病和免疫过程

急性髓性白血病(AML,Acute myeloid leukemia)是一种存在于复杂微环境中的疾病。作者基于scRNA-seq分析了来自40例骨髓抽吸donor的38,410个细胞,包括16例AML患者和5例健康donor。然后,应用机器学习分类器来区分恶性细胞类型。

发现:细胞类型组成与原型遗传病变相关。原始AML细胞表现出与干细胞和髓系启动基因共同表达的转录程序失调,并具有预后意义。分化的单核细胞-like AML细胞在体外表达多种免疫调节基因并抑制了T细胞活性。

来自:Single-Cell RNA-Seq Reveals AML Hierarchies Relevant to Disease Progression and Immunity, Cell, 2019

背景概述

急性髓系白血病(AML)是一种侵袭性血癌(容易侵袭到周围组织和器官),其特征是髓系未成熟细胞的积累。虽然大多数患者最初对化疗有良性响应,但75%的患者在诊断后5年内复发并死于各种疾病。

AML细胞多样性的一个来源是髓细胞-myeloid发育的部分再现。正常的造血干细胞(HSCs,hematopoietic stem cells)产生成熟的髓系-myeloid、淋巴系-lymphoid和红系-erythroid/巨核系-megakaryocyte 血细胞。AML肿瘤也包括原始细胞和分化细胞。原始AML细胞,通常被称为白血病干细胞(LSCs,leukemia stem cells),维持疾病状态并表现出干细胞特性,如自我更新、治疗抵抗。分化的AML细胞缺乏自我更新能力,但具有对肿瘤微环境或造血功能的病理作用。

AML的疾病进展受微环境中正常细胞的影响。AML细胞的内在特性,包括免疫调节因子的表达和外部微环境变化,可导致抑制性T调节细胞(T-reg)的积累,并损害细胞毒性T淋巴细胞(CTL)的激活。增强T细胞介导的AML细胞清除是一种有吸引力的治疗策略,但免疫治疗试验在相比其他癌症中的成功程度,AML治疗效果并不好。这也突出了探索AML微环境中免疫抑制的细胞成分和机制的迫切需要。

  • 注意:恶性细胞和间质细胞共同塑造微环境,恶性细胞可以诱导间质细胞产生特定的细胞因子,这些因子反过来又促进肿瘤的生长和转移,因此,现在研究人员正在探索以间质细胞为靶点的治疗方法,以克服肿瘤细胞对传统化疗药物的耐药性。例如,通过调控CAFs(癌症相关成纤维细胞)来抑制肿瘤的生长和转移,已成为肿瘤治疗的新手段。

scRNA-seq提供了表征肿瘤中恶性-malignant和间质-stromal细胞群的有力手段。然而,AML面临着独特的挑战,这与肿瘤生态系统中恶性细胞和正常细胞之间复杂的分化层次和相似性有关。为了全面分析AML异质性,作者采用基于纳米孔的技术-nanowell-based technology 从骨髓(BM)抽吸物中获取数千个单细胞的转录和突变数据。作者通过scRNA-seq分析了来自16名AML患者的30,712个细胞和来自5名健康donors的7,698个细胞。将这些数据整合到一个机器学习分类器中,该分类器区分了恶性细胞和正常细胞,并确定了六种恶性AML细胞亚型,它们沿着HSCs向髓细胞-myeloid分化的空间投影。作者利用这一资源将发育等级与基因型-genotypes联系起来,评估原始AML细胞的特性和预后意义,并鉴定具有免疫调节特性的分化AML细胞。

健康骨髓样本的细胞群鉴定

为了表征健康骨髓(BM)的基线细胞多样性,作者使用基于高通量纳米孔的方案(称为Seq-Well)进行了scRNA-seq测序。分析了来自4个健康donor(21-56岁)的存活冷冻细胞和来自第五个健康donor的富集祖细胞(CD34+ CD38 -和CD34+)。获得了7698个健康donors的骨髓细胞的高质量数据。

使用BackSPIN无监督聚类来区分细胞类型(图1A)。有注释细胞群建立在已知markers上,如HSC/Prog细胞簇的CD34࿰

单细胞RNA测序(scRNA-seq分析是一种用于研究单个细胞基因表达的技术。通过scRNA-seq分析,研究人员可以深入了解细胞异质性、细胞类型鉴定以及基因调控网络等生物学问题。以下是scRNA-seq分析的主要步骤: 1. **样本准备**:从组织或细胞群体中分离单个细胞,并进行细胞裂解,提取RNA。 2. **文库构建**:将提取的RNA逆转录为cDNA,并进行PCR扩增,构建测序文库。 3. **测序**:使用高通量测序技术(如Illumina平台)对构建的文库进行测序,获取单细胞转录组数据。 4. **数据预处理**:包括质量控制、去除接头序列、低质量读段的过滤等。 5. **比对与定量**:将测序读段比对到参考基因组或转录组上,并进行基因表达的定量分析。 6. **标准化**:对数据进行标准化处理,以消除批次效应测序深度的影响。 7. **降维与聚类**:使用降维技术(如PCA、t-SNE、UMAP)将高维数据降维,并在降维后的空间中聚类,识别不同的细胞类型。 8. **差异表达分析**:比较不同细胞类型或条件下的基因表达差异,识别具有生物学意义的差异表达基因。 9. **功能富集分析**:对差异表达基因进行功能富集分析,揭示其参与的生物学过程信号通路。 10. **细胞轨迹推断**:通过分析细胞间的基因表达变化,推断细胞分化轨迹状态转换。 scRNA-seq分析在发育生物学、肿瘤研究、免疫学等领域有广泛应用,能够提供传统批量RNA测序无法获得的精细细胞水平信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值