REPRA是今年出来的一种用于评估基因拼接质量的通用工具。在读了一天手册之后,进行了一点实验。
对于小的基因组,使用short和long insert reads就可以了。实验用的是Staphylococcus aureus,这个基因组感觉不大。genome.fa只有2.4M。reads文件每个120多M。
用reapr smaltmap assembly.fa long_1.fq long_2.fq long_mapped.bam(有改动)产生long_mapped.bam文件,用bamtools来查看一下结果,如图;
bamtools stats ........:
简单的完整流程只要三个命令:
reapr perfectmap assembly.fa short_1.fq short_2.fq 300 perfect
reapr smaltmap assembly.fa long_1.fq long_2.fq long_mapped.bam
reapr pipeline assembly.fa long_mapped.bam output_directory perfect
结果的图:
01.stats.FCDerror.pdf
01.stats.fragment_coverage.pdf
01.stats.fragment_length.pdf
02.fcdrate.plot.pdf