Monopogen:单细胞测序数据的SNV调用工具
Monopogen SNV calling from single cell sequencing 项目地址: https://gitcode.com/gh_mirrors/mo/Monopogen
项目介绍
Monopogen 是一款专门用于单细胞测序数据的单核苷酸变异(SNV)调用分析工具。该工具由 MDACC 的 Ken chen 实验室开发与维护。Monopogen 支持多种单细胞测序技术生成的数据,如 10x 5'、10x 3'、单细胞 ATAC-seq 和 scDNA-seq 等。Monopogen 通过三个模块提供全面的 SNV 调用功能:数据预处理、杂合子 SNV 调用和体细胞 SNV 调用。
项目技术分析
Monopogen 在单细胞测序数据上实现 SNV 调用,主要依赖以下几个技术亮点:
- 数据预处理:去除单细胞测序中高对齐错误率的读段,并确保数据格式与 Monopogen 兼容。
- 利用连锁不平衡提高准确性:通过使用外部参考面板(如 1000 Genome 数据库)中的连锁不平衡信息,来提高 SNV 调用的准确性和灵敏度。
- 体细胞 SNV 调用:将群体水平的连锁不平衡机制扩展到细胞群体水平,统计地推断每个细胞中观察到的等位基因的相位,以计算体细胞 SNV 的概率得分。
项目技术应用场景
Monopogen 的应用场景广泛,适用于以下几种情况:
- 单细胞样本的祖源鉴定
- 在细胞水平上进行全基因组关联研究(GWAS)
- 探索体细胞 SNV
项目特点
Monopogen 具有以下特点:
- 高度兼容性:支持多种单细胞测序技术。
- 准确性提升:利用连锁不平衡信息提升 SNV 调用准确性。
- 快速高效:新版本优化了算法,实现了超过10倍的速度提升。
- 易于安装和使用:提供详细的安装说明和快速入门指南,降低使用门槛。
- 持续更新:项目持续更新,修复问题并添加新的功能,如基于细胞类型信息的变异筛选。
下面我们来详细看看 Monopogen 的各个模块和功能。
核心功能:单细胞测序数据的SNV调用
Monopogen 的核心功能是针对单细胞测序数据执行 SNV 调用。以下是该工具的几个关键步骤:
- 数据预处理:通过去除高对齐错误率的读段,确保后续分析的准确性。
- 杂合子 SNV 调用:利用连锁不平衡信息,提高单细胞数据中 SNV 调用的准确性和灵敏度。
- 体细胞 SNV 调用:通过统计分析方法,推断单细胞中的体细胞 SNV。
Monopogen 的输出结果可支持单细胞样本的祖源鉴定、基因组关联研究,以及体细胞 SNV 的探索。
项目安装
Monopogen 可以通过 Git 进行安装。以下是安装命令:
git clone https://github.com/KChen-lab/Monopogen.git
cd Monopogen
pip install -e .
快速入门
Monopogen 提供了快速入门示例,可以帮助用户快速上手。以下是使用示例数据集进行数据预处理的命令:
path="XXX/Monopogen"
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:${path}/apps
python ${path}/src/Monopogen.py preProcess -b bam.lst -o out -a ${path}/apps
完成数据预处理后,可以使用以下命令进行杂合子 SNV 调用:
python ${path}/src/Monopogen.py germline -a ${path}/apps -t 1 -r region.lst -p ../example/ -g ../example/chr20_2Mb.hg38.fa -s all -o out
Monopogen 的使用不仅限于上述示例,用户可以根据实际需求调整参数和模块。
总的来说,Monopogen 是一款功能强大、易于使用且持续更新的单细胞测序数据 SNV 调用工具,适用于多种生物学研究和临床诊断场景。通过其高效准确的调用方法,Monopogen 为单细胞基因组学研究提供了有力支持。
Monopogen SNV calling from single cell sequencing 项目地址: https://gitcode.com/gh_mirrors/mo/Monopogen
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考