CReSIL: 从长读长序列中准确识别染色体外环状DNA
安装说明
## 安装 Conda 环境
cd cresil
conda env create -f environment.yml
## 激活 CReSIL 环境
conda activate cresil
## 安装 CReSIL
pip install .
测试(人类 eccDNA)
## 进入示例文件夹
cd example
## 运行 trim
cresil trim -t 4 -fq exp_reads.fastq -r reference.mmi -o cresil_result
## 运行 eccDNA 识别以丰富数据
cresil identify -t 4 -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -cm r941_min_hac_g507 -trim cresil_result/trim.txt
## 运行 eccDNA 注释
cresil annotate -t 4 -rp reference.rmsk.bed -cg reference.cpg.bed -gb reference.gene.bed -identify cresil_result/eccDNA_final.txt
## 运行可视化 eccDNA (ec1)
cresil visualize -t 4 -c ec1 -identify cresil_result/eccDNA_final.txt
## 运行 Circos (ec1)
cd cresil_result/for_Circos/ec1
circos -noparanoid -conf circos.conf
CReSIL 生成的文件和目录结构如下:
cresil_result/
├── trim.txt
├── eccDNA_final.txt
├── cresil_run/
│ ├── subGraphs.summary.txt
│ ├── tmp/
│ └── assemGraph/
│ ├── ec1/
│ ├── ec2/
│ └── ..
├── cresil_gAnnotation/
│ ├── gene.annotate.txt
│ ├── CpG.annotate.txt
│ ├── repeat.annotate.txt
│ └── variant.annotate.txt
└── for_Circos/
└── ec1/
├── circos.conf
├── ticks.conf
├── ideogram.conf
├── karyotype.conf
├── data/
└── tmp/
有关每个 eccDNA 的映射读长的更多详细信息,请参阅 assemGraph 中的 eccDNA 文件夹。
其他有用的命令
要运行 CReSIL 以识别 eccDNA 而不进行序列校正和变异检测步骤 - 跳过模式(从修剪步骤开始)
## 运行 eccDNA 识别而不进行序列校正和变异检测步骤
cresil identify -t 4 -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -cm r941_min_hac_g507 -s -trim cresil_result/trim.txt
要运行 CReSIL 以在宽松模式下识别 eccDNA(从修剪步骤开始)
## 运行 eccDNA 识别并最小化参数(eccDNA 的最小大小、平均深度、支持的断点数量)
cresil identify -t 4 -minrsize 40 -depth 1 -break 1 -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -cm r941_min_hac_g507 -trim cresil_result/trim.txt
要使用 CReSIL 识别全基因组长读长(WGLS)测序数据中的 eccDNA(从修剪步骤开始)
## 运行 eccDNA 识别以进行全基因组长读长(WGLS)测序数据
cresil identify_wgls -t 4 -r reference.mmi -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -trim cresil_result/trim.txt
接口
cresil trim
- 从 ONT 读长中查找并修剪潜在的 eccDNA 区域cresil identify
- 从丰富数据中识别并验证 eccDNAcresil identify_wgls
- 从全基因组长读长(WGLS)测序数据中识别并验证 eccDNAcresil annotate
- 注释已识别的 eccDNAcresil visualize
- 为指定的 eccDNA 生成 Circos 配置文件
示例数据
参考文献和模拟数据 供用户通过 CReSIL 管道示例并用于 CReSIL 基准测试。
- 参考文献
- 模拟数据