CReSIL: 从长读长序列中准确识别染色体外环状DNA

CReSIL: 从长读长序列中准确识别染色体外环状DNA

安装说明

## 安装 Conda 环境
cd cresil
conda env create -f environment.yml

## 激活 CReSIL 环境
conda activate cresil

## 安装 CReSIL
pip install .

测试(人类 eccDNA)

## 进入示例文件夹
cd example

## 运行 trim
cresil trim -t 4 -fq exp_reads.fastq -r reference.mmi -o cresil_result

## 运行 eccDNA 识别以丰富数据
cresil identify -t 4 -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -cm r941_min_hac_g507 -trim cresil_result/trim.txt

## 运行 eccDNA 注释
cresil annotate -t 4 -rp reference.rmsk.bed -cg reference.cpg.bed -gb reference.gene.bed -identify cresil_result/eccDNA_final.txt

## 运行可视化 eccDNA (ec1)
cresil visualize -t 4 -c ec1 -identify cresil_result/eccDNA_final.txt

## 运行 Circos (ec1)
cd cresil_result/for_Circos/ec1
circos -noparanoid -conf circos.conf

CReSIL 生成的文件和目录结构如下:

cresil_result/
├── trim.txt
├── eccDNA_final.txt
├── cresil_run/
│   ├── subGraphs.summary.txt
│   ├── tmp/
│   └── assemGraph/
│       ├── ec1/
│       ├── ec2/
│       └── ..
├── cresil_gAnnotation/
│   ├── gene.annotate.txt
│   ├── CpG.annotate.txt
│   ├── repeat.annotate.txt
│   └── variant.annotate.txt
└── for_Circos/
    └── ec1/
        ├── circos.conf
        ├── ticks.conf
        ├── ideogram.conf
        ├── karyotype.conf
        ├── data/
        └── tmp/

有关每个 eccDNA 的映射读长的更多详细信息,请参阅 assemGraph 中的 eccDNA 文件夹。

其他有用的命令

要运行 CReSIL 以识别 eccDNA 而不进行序列校正和变异检测步骤 - 跳过模式(从修剪步骤开始)

## 运行 eccDNA 识别而不进行序列校正和变异检测步骤
cresil identify -t 4 -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -cm r941_min_hac_g507 -s -trim cresil_result/trim.txt

要运行 CReSIL 以在宽松模式下识别 eccDNA(从修剪步骤开始)

## 运行 eccDNA 识别并最小化参数(eccDNA 的最小大小、平均深度、支持的断点数量)
cresil identify -t 4 -minrsize 40 -depth 1 -break 1 -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -cm r941_min_hac_g507 -trim cresil_result/trim.txt

要使用 CReSIL 识别全基因组长读长(WGLS)测序数据中的 eccDNA(从修剪步骤开始)

## 运行 eccDNA 识别以进行全基因组长读长(WGLS)测序数据
cresil identify_wgls -t 4 -r reference.mmi -fa reference.fa -fai reference.fa.fai -fq exp_reads.fastq -trim cresil_result/trim.txt

接口

  • cresil trim - 从 ONT 读长中查找并修剪潜在的 eccDNA 区域
  • cresil identify - 从丰富数据中识别并验证 eccDNA
  • cresil identify_wgls - 从全基因组长读长(WGLS)测序数据中识别并验证 eccDNA
  • cresil annotate - 注释已识别的 eccDNA
  • cresil visualize - 为指定的 eccDNA 生成 Circos 配置文件

示例数据

参考文献和模拟数据 供用户通过 CReSIL 管道示例并用于 CReSIL 基准测试。

  • 参考文献
  • 模拟数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值