解析proseg项目处理MERSCOPE FFPE数据的技术要点
proseg是一个用于空间转录组数据分析的开源工具,在处理MERSCOPE FFPE(福尔马林固定石蜡包埋)样本数据时,需要特别注意数据预处理步骤。本文将详细介绍处理这类特殊样本的技术要点。
FFPE样本数据的特殊性
MERSCOPE FFPE样本数据与常规MERFISH数据在数据结构上存在差异,主要体现在转录本与细胞ID的对应关系上。常规MERFISH数据会直接为每个转录本分配细胞ID,而FFPE样本数据采用了不同的命名规范,需要额外的处理步骤才能与proseg兼容。
转录本到细胞的分配方法
为了将FFPE样本数据转换为proseg可处理的格式,需要进行以下关键步骤:
-
数据准备:需要获取两个关键文件
detected_transcripts.csv.gz
:包含检测到的所有转录本信息cell_boundaries
目录:包含细胞边界定义信息
-
转换处理:使用专门的Python脚本将原始数据转换为proseg兼容格式。该脚本会:
- 解析转录本的空间坐标信息
- 根据细胞边界定义确定每个转录本所属的细胞
- 生成包含转录本-细胞对应关系的输出表格
-
proseg运行参数:处理后的数据需要使用
--merfish
参数运行proseg,虽然该参数已被标记为"deprecated",但对于FFPE样本数据的分析仍然是必要的。
实际应用建议
对于希望使用proseg分析MERSCOPE FFPE数据的研究人员,建议:
- 确保数据文件的完整性和路径正确性
- 注意Python脚本运行环境的依赖项配置
- 转换后的数据质量直接影响后续分析结果,建议进行必要的质量控制
- 虽然
--merfish
参数显示为不推荐使用,但在FFPE数据分析场景下可以安全使用
通过以上步骤,研究人员可以成功地将MERSCOPE FFPE样本数据转换为proseg可处理的格式,进而利用proseg强大的空间转录组分析功能进行深入研究。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考