LUMPY SV 安装与使用指南
概述
LUMPY(一个通用的概率框架)是用于发现结构变异的强大工具,由Ryan M Layer, Colby Chiang, Aaron R Quinlan以及Ira M Hall在2014年开发。此框架支持高级用户进行灵活定制的结构变异检测,同时也提供了简化版的LUMPY Express以适应标准分析需求。
目录结构及介绍
LUMPY的项目目录大致结构如下:
- bin: 包含所有可执行文件,如
lumpyexpress、lumpy等。 - data: 可能存放测试数据或预处理脚本需要的数据文件。
- lib: 项目的库文件或者依赖的辅助代码。
- lumpy_tests: 单元测试相关文件。
- scripts: 包括一系列用于辅助数据处理的脚本,例如提取split reads的脚本。
- src: 主要的源代码目录。
- tests: 测试案例和相关脚本。
- travis.yml: Travis CI的配置文件。
- LICENSE: 许可证文件,说明了软件使用的MIT许可证。
- Makefile: 构建系统的规则文件,用于编译和安装项目。
- README.md: 项目的主要说明文档,包含了快速入门、安装、使用方法等内容。
启动文件介绍
主要可执行文件
- lumpy: 传统的命令行工具,提供高度自定义的参数,适用于有特殊要求的结构变异检测。
- lumpyexpress: 简化版本的LUMPY,自动化处理标准分析流程,适合快速运行和基础应用。
启动示例:
-
使用LUMPY Express:
lumpyexpress -B sample.bam -S sample.split.bam -D sample.discordant.bam -o variants.vcf -
传统LUMPY的调用可能会更复杂,需要明确指定更多参数来运行。
配置文件介绍
-
lumpyexpress.config: 这是一个重要的配置文件,位于
scripts/目录下或通过-K参数指定的位置。它定义了外部程序的路径,确保LUMPY Express可以找到并调用这些程序。这个文件通常由安装过程自动生成,并且用户可以根据需要调整。 -
在安装过程中,Makefile会自动创建一个放在
bin目录下的lumpyexpress.config,如果需要自定义ZLIB路径或其他编译选项,安装时需额外设置环境变量并重新制作。
快速开始
-
安装:
git clone --recursive https://github.com/arq5x/lumpy-sv.git cd lumpy-sv make sudo cp bin/* /usr/local/bin/ -
基本配置: 确保所有的依赖项已正确安装,如Samtools、Python及其必要的库(pysam, NumPy)等。
-
运行LUMPY Express: 根据你的输入文件路径,调整以下命令中的文件名:
lumpyexpress -B your.sorted.bam -S your.splitters.bam -D yourdiscordants.bam -o output.vcf
请注意,这只是一个基本的使用引导。对于具体的参数配置和复杂的使用场景,务必详细阅读项目提供的README.md文件,了解每个参数的具体作用以及如何优化分析流程。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考



