测序数据质量检查与比对实用指南
1. 测序数据质量检查
1.1 测序污染问题检查
测序数据可能会受到引物、接头或其他污染物的影响。为了确定具体使用的引物和接头,可联系测序服务提供商,以防FastQC提供的列表不是最新的。污染问题的结果存于 contaminated_fastqc 文件夹中,重点关注“Overrepresented sequences”表,从“Possible Source”列可知,问题由双端PCR引物和接头导致。
FastQC是一个全面的测序数据质量检查程序,更多信息可访问 http://www.bioinformatics.babraham.ac.uk 。
1.2 Fastx - toolkit安装
完成数据集质量检查后,需为后续的比对工作准备数据。Fastx - toolkit是用于FASTQ文件预处理的工具集,可从 http://hannonlab.cshl.edu/fastx_toolkit/download.html 下载。
在Linux环境下的安装步骤如下:
$ wget http://hannonlab.cshl.edu/fastx_tool - kit/fastx_t
超级会员免费看
订阅专栏 解锁全文
27

被折叠的 条评论
为什么被折叠?



