介绍
Canu专门组装PacBio或Oxford Nanopore序列。Canu分为三个阶段:校正、修整和装配。校正阶段将提高读取中基数的准确性。微调阶段将微调显示为高质量序列的部分的读取,删除可疑区域,如剩余的SMRTbell适配器。组装阶段将把读取排序为重叠,生成一致序列,并创建备用路径图。
输入序列可以是FASTA或FASTQ格式,未压缩或用gzip(.gz)、bzip2(.bz2)或xz(.xz)压缩。请注意,不支持zip文件(.zip)。
官方测试数据下载
下面包括了pacbio、Nanopore以及Pacbio HIFI的测试数据集
1 2 3 4 5 6 7 8 9 10 11 12 13
|
#Pacific Biosciences released P6-C4 chemistry reads for Escherichia coli K12. curl -L -o pacbio.fastq http://gembox.cbcb.umd.edu/mhap/raw/ecoli_p6_25x.filtered.fastq
#Oxford Nanopore样本数据(Escherichia coli K12) curl -L -o oxford.fasta http://nanopore.s3.climb.ac.uk/MAP006-PCR-1_2D_pass.fasta
#PacBio测序的大肠杆菌K12 HiFi数据集 curl -L -o ecoli.fastq https://sra-pub-src-1.s3.amazonaws.com/SRR10971019/m54316_180808_005743.fastq.1
canu \ -p asm -d ecoli_hifi \ genomeSize=4.8m \ -pacbio-hifi ecoli.fastq
|
软件安装