2025 年 6 月10x Genomics 的 Space Ranger 软件在升级到了 v4.0 版本。这个新版本最大的亮点就是支持了 Visium HD 和 Visium HD 3' 空间基因表达数据的 H&E 显微图像使用 StarDist v6算法框架来实现细胞分割。StarDist 是一个基于卷积神经网络(CNN)的深度学习模型,它采用了类似 U-Net 的编码器 - 解码器架构,能够从输入图像中提取相关特征,并输出一组带标签的实例掩码,以星形凸多边形的形式勾勒出各个细胞。这种方法的优势在于能够在高度拥挤的环境中准确分离紧密聚集的细胞并定义细胞边界,特别适合处理复杂的生物医学图像。
10x Genomics官方介绍说为了训练这个细胞分割模型,使用了超过 150 张 HE 染色图的 1.7 万个图块,涵盖了多种人类和小鼠组织类型,包括胸腺、皮肤(黑色素瘤)、前列腺、结肠、结肠癌、乳腺癌、扁桃体、脑癌、肺癌、脾脏、脑、骨、睾丸、小肠、肝、肺、肾等。这使得模型具有很强的泛化能力和准确性,能够适应不同类型的组织样本。之前我们也介绍过HD数据使用StarDist进行细胞核分割(Visium HD 空间转录组分析探索之--细胞核分割)和使用cellpose进行细胞分割(Visium HD使用Cellpose进行细胞分割获取单细胞精度空间数据),获取单细胞核测序精度的数据进行下游分析,10x官方也给出了细胞核分割的完整代码,但是使用起来相对比较繁琐。
spaceranger segment的使用方法比较简单,这里我们就不展开详细介绍了,官方有详细说明,地址:https://www.10xgenomics.com/support/software/space-ranger/latest/analysis/running-pipelines/command-line-arguments
1. spaceranger segment完成后,在web Summary文件中会包含一个Cell segmentation页面,具体统计信息如下
2. 细胞分割后的,细胞Cluster空间分布情况
3. 细胞分割后细胞核大小,细胞中基因数、UMI统计,以及降维聚类UMAP展示
放大分割后的细胞轮廓长这样,细胞边界呈锯齿状,而非平滑曲线,这也很容易理解,因为Visium HD的最高分辨率是2um的小方格
4. 细胞分割结果输出在segmented_outputs文件夹下,里面的文件包含
5. 分割后的单细胞数据及细胞空间信息读取(由于spaceranger4.0刚出不久,Seurat和scanpy都还没有现成的函数直接读取)这里我们可以稍加改造,和之前使用stardist进行细胞分割一样,先读分割后细胞的表达信息,然后加上细胞边界坐标信息,基于边界信息能获取细胞质心坐标
读取细胞表达信息,简单降维聚类:
分割后的细胞轮廓,呈锯齿状
空间上展示细胞的基因表达
降维聚类空间展示
局部细胞聚类空间展示