scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell RNA-seq data
今天阅读一篇2022年发表在Nature Machine Intelligence上的文章,题目为“ scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell RNA-seq data”,文章提出了scBERT方法,这是一种将BERT模型应用到单细胞转录组的数据处理上的方法,方法在细胞类型注释上表现出了优秀性能,并且发现新的细胞类和 模型可解释性上的应用。本文的通讯作者是腾讯AI实验室的姚建华博士和上海交通大学的吕晖教授。
论文地址:https://www.nature.com/articles/s42256-022-00534-z
Abstract
根据单细胞RNA测序数据对细胞类型进行注释是研究疾病进展和肿瘤微环境的前提。在这里,我们展示了现有的注释方法通常面临着缺乏筛选基因列表、批次效应处理不当以及难以利用潜在的基因-基因相互作用信息的问题,这影响了它们的泛化性和稳健性。为了克服这些挑战,我们开发了一种基于