CellChat是先识别出高表达的配体受体,并识别这些高表达的配体-受体相互作用,并为每个相互作用分配一个概率值,并且采用并行计算的方法,去推断具有生物学意义的细胞间通讯网络。
从生物学角度来看,比如患病的组织相比于没有患病的组织,一定有一部分细胞当中的某些配体和受体,一定是有更高表达了的(或者更低表达了的),于是我们要采用统计学方法去计算各个配体和受体之间相互作用的概率,然后用可视化去展现出来。
核心原理
CellChat通过两个关键机制推断有生物学意义的细胞间通讯:
- 为每个互作分配概率值
- 执行置换检验验证统计显著性
它结合基因表达数据和已知的信号配体、受体及其辅助因子之间的互作先验知识,使用质量作用定律建模细胞间通讯概率。
关键参数选择
平均基因表达计算方法
代码强调了平均基因表达计算方法对结果的重要影响:
- 默认方法:
triMean
(统计学上稳健的平均值方法)- 产生较少但更强的互作
- 近似于25%截断平均值(如果一个细胞群中表达细胞<25%,平均表达为零)
- 替代方法:
truncatedMean
(可以设置截断比例)- 设置
trim = 0.1
使用10%截断平均值 - 产生更多的互作,适合探索已知但未被默认方法检测到的通路
- 设置
为了确定合适的trim值,CellChat提供了一个函数computeAveExpr,可以检查某段信号基因的平均表达。如果在一个已知的信号通路未被检测到,我们可以尝试使用更低的trim值,去重新计算每个cell group平均基因表达量。
当分析未经细胞分选的单细胞转录组时,CellChat可以考虑细胞比例的影响:
- 基于假设:丰富