CNVnator

CNVnator是一款用于检测和分析全基因组测序数据中CNV的软件。通过docker或github安装后,利用sam/bam文件及参考基因组进行分析。其依赖ROOT软件包,分析过程包括读取映射、生成深度直方图、计算统计、信号分区和CNV呼叫。结果包含CNV类型、位置、长度和归一化的read depth等信息。

CNVnator

CNVnator是一款CNV检测软件,通过对全基因组测序数据进行分析来预测CNV。拷贝数变异(Copy Number Variation,CNV)是基因结构变异(StructuralVariant,SV)的重要组成部分,由基因组发生重排而导致, 一般指长度为1 kb以上的基因组大片段的拷贝数增加或者减少, 主要表现为亚显微水平的缺失和重复。

CNVnator相关使用方法来啦!!!

一、安装

1)通过docker镜像安装:

docker pull diploid/cnvnator

2)从github安装

gitclone https://github.com/abyzovlab/CNVnator.git
cdCNVnator
ln-s /path/to/src/samtools samtools
make

二、软件使用

注意:CNVnator中依赖 ROOT 这个软件包,这个软件包是专门针对大数据的处理进行开发的,提供了统计分析,可视化,数据存储等一系列功能,基于这个体系可以极大的加快运行速度,所以将原始的信息都存在root文件中,便于分析.

1)准备文件:sam/bam文件,参考基于组及其索引文件

2)EXTRACTING READ MAPPING FROM BAM/SAM FILES

cnvnator-rootfile.root-treetest.bam-chrom 1

参数说明:
-root : 指定输出 ROOT 文件
-chrom : 指定染色体名称
-tree : 指定 bam 文件名

3)GENERATING A READ DEPTH HISTOGRAM

cnvnator-rootfile.root-his   10   -dgenome.dir

参数说明:
-his : 指定窗口的大小,单位为bp
-d : 参考基因组fasta文件所在的目录

4)CALCULATING STATISTICS

cnvnator   -root   file.root   -stat 10

参数说明:
-stat: 指定窗口的大小,和第二步的 -his 参数的取值相同。

5)RD SIGNAL PARTITIONING

cnvnator-rootfile.root-partition   10

参数说明:
-partition: 指定窗口的大小,和第二步的 -his 参数的取值相同。

6)CNV CALLING

cnvnator-rootfile.root-call   10   >   cnv.call.txt

参数说明:
-call : 指定窗口的大小,和第二步的 -his 参数的取值相同,

三、结果

第一列为CNV的类型,包括了deletion和duplication两种类型
第二列为CNV的染色体区域
第三列为CNV的长度,第四列为归一化之后的read depth, 归一化到0-1的范
第五列到第八列为不同的evalue值,最后一类为q0
在这里插入图片描述

### 使用 CNVnator 进行拷贝数变异 (CNV) 分析 #### 准备工作 为了使用 CNVnator 软件进行 CNV 分析,需先安装并配置好必要的环境。通常情况下,这包括准备参考基因组文件以及 BAM 或者 ROOT 文件格式的测序数据。 #### 数据预处理 在正式分析之前,需要对原始测序数据进行质量控制和比对操作,确保获得高质量的映射结果用于后续分析。对于已经完成比对的数据,则可以直接进入下一步骤[^2]。 #### 创建根文件 (.root) 通过命令 `cnvnator -root sample.root -tree sorted.bam` 可以创建一个包含读取深度信息的 .root 文件。此过程会统计每个位置上的覆盖度,并将其存储起来供进一步计算使用。 #### 定义窗口大小 根据实验设计和个人需求设定合适的 bin size 参数来定义染色体上划分的小区域尺寸。一般推荐采用默认设置即 100bp 的宽度作为起始尝试: ```bash cnvnator -root sample.root -his 100 ``` 上述指令会在指定范围内建立直方图结构以便于之后识别潜在的变化区间。 #### 执行 CNV 检测 利用先前构建好的历史记录文件来进行实际的目标检测任务: ```bash cnvnator -root sample.root -stat 100 cnvnator -root sample.root -partition 100 cnvnator -root sample.root -call 100 > calls.txt ``` 这些步骤依次完成了统计数据收集、分割策略制定以及最终调用预测三个环节的工作流程;其中最后一个命令将会把发现的所有可能存在的 CNVs 输出至文本文件中保存下来待审阅验证。 #### 结果可视化与解释 最后一步是对所得出的结果加以图形化展示辅助理解。可以借助内置绘图功能快速生成直观图表帮助定位异常位点的位置分布情况: ```bash cnvnator -root sample.root -view chrom:start-end -draw png ``` 这里 `-view` 后面接具体要查看的染色体区段范围,而 `-draw png` 则指定了输出图像的形式为 PNG 格式图片文件。 综上所述,整个基于 CNVnator 平台开展 CNV 探索的过程涵盖了从样本制备直至结论得出的一系列严谨有序的操作规程[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值