GTDB-Tk-classify_wf结果输出文件完全解读

#GTDB-Tk 的 classify_wf 工作流程会输出多个文件,这些文件分别存放在几个不同的文件夹内,包括对微生物基因组的比对、多序列对齐、分类和标记基因的分析结果。以下是对每个文件夹和文件的详细解析#

GTDB-Tk-classify_wf输出文件共含3个目录、3个log文件:


目录1-align

这个文件夹主要保存多序列对齐的结果,包括所提供的基因组的对齐以及GTDB数据库中的参考序列的对齐。

1.1 _gtdbtk.ar53.filtered.tsv
这是一个过滤后的Archaea(古菌)基因组标记数据,GTDB-Tk 可能在对齐过程中筛选了一些低质量的基因组或标记基因。

1.2_gtdbtk.ar53.msa.fasta.gz

压缩的多序列对齐文件,包含了与Archaea数据库中参考序列的对齐结果(msa 代表多序列对齐 “multiple sequence alignment”)。

1.3_gtdbtk.ar53.user_msa.fasta.gz

压缩的用户基因组与Archaea数据库中的标记基因的多序列对齐结果。

1.4_gtdbtk.bac120.msa.fasta.gz

压缩的多序列对齐文件,包含了与Bacteria数据库中的120个通用标记基因的对齐结果。

1.5_gtdbtk.bac120.user_msa.fasta.gz

用户基因组与Bacteria(细菌)数据库中120个通用标记基因的多序列对齐文件。

目录2-classify

这个文件夹主要保存多序列对齐的结果,包括所提供的基因组的对齐以及GTDB数据库中的参考序列的对齐。

2.1 _gtdbtk.ar53.classify.tree

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值