#GTDB-Tk 的 classify_wf 工作流程会输出多个文件,这些文件分别存放在几个不同的文件夹内,包括对微生物基因组的比对、多序列对齐、分类和标记基因的分析结果。以下是对每个文件夹和文件的详细解析#
GTDB-Tk-classify_wf输出文件共含3个目录、3个log文件:
目录1-align
这个文件夹主要保存多序列对齐的结果,包括所提供的基因组的对齐以及GTDB数据库中的参考序列的对齐。
1.1 _gtdbtk.ar53.filtered.tsv
这是一个过滤后的Archaea(古菌)基因组标记数据,GTDB-Tk 可能在对齐过程中筛选了一些低质量的基因组或标记基因。
1.2_gtdbtk.ar53.msa.fasta.gz
压缩的多序列对齐文件,包含了与Archaea数据库中参考序列的对齐结果(msa 代表多序列对齐 “multiple sequence alignment”)。
1.3_gtdbtk.ar53.user_msa.fasta.gz
压缩的用户基因组与Archaea数据库中的标记基因的多序列对齐结果。
1.4_gtdbtk.bac120.msa.fasta.gz
压缩的多序列对齐文件,包含了与Bacteria数据库中的120个通用标记基因的对齐结果。
1.5_gtdbtk.bac120.user_msa.fasta.gz
用户基因组与Bacteria(细菌)数据库中120个通用标记基因的多序列对齐文件。
目录2-classify
这个文件夹主要保存多序列对齐的结果,包括所提供的基因组的对齐以及GTDB数据库中的参考序列的对齐。
2.1 _gtdbtk.ar53.classify.tree

最低0.47元/天 解锁文章
3306

被折叠的 条评论
为什么被折叠?



