细胞类型分类是单细胞测序分析中的关键步骤。目前已经提出了各种方法将细胞类型标签从注释的参考图谱转移到未注释的查询数据集。现有的细胞类型标签转移方法缺乏对结果注释的不确定性估计,限制了可解释性和实用性。为了解决这个问题,作者提出了popV,这是一组具有投票方案的预测模型。PopV 实现了准确的细胞类型注释并提供不确定性分数。在多个案例研究中,popV 自信地注释了大多数细胞,同时突出显示了难以通过标签转移注释的细胞群。这个额外的步骤有助于减少手动检查的负担,这通常是注释过程的必要组成部分,并使我们能够专注于注释中最有问题的部分,从而简化整个注释过程。
来自:Consensus prediction of cell type labels in single-cell data with popV, Nature Genetics, 2024
背景概述
细胞类型注释是分析 scRNA-seq 数据的关键任务。注释的质量直接影响下游分析,例如细胞类型组成的比较以及基于每个细胞类型进行的分析。手动注释非常耗时,需要特定于生物学背景和特定于测序技术的领域知识。因此,随着 scRNA-seq 成为越来越标准的实验技术,生成自动注释的需求也日益增加。作者在此建议使用一组细胞类型预测模型,不仅可以提供自动注释,还可以提供经过良好校准的不确定性度量。这使用户能够简化注释过程。自动细胞类型注释面临多项挑战。在特定数据集中,没有细胞类型注释的黄金标准。当细胞状态不断变化时,细胞类型之间的划分是不精确的,甚至人类专家也可能对特定细胞的确切表型存在分歧。因此,注释方法应该突出不确定性的量化。
为了应对这些挑战,开发了popV,这是一种灵活且可扩展的自动化细胞类型注释框架,它从 scRNA-seq