# 1.基因预测
source activate prokka
for file in LWJ/*.fna; do
# 提取文件名(不含路径和扩展名)
filename=$(basename "$file" .fna)
# 构建运行命令
prokka $file --outdir $filename --prefix $filename --kingdom Bacteria
done
source deactivate
# 2.复制文件到一个新的文件夹faa中(这个只是为了自己方便)
mkdir faa
for file in G/*/*.faa; do
filename=$(basename "$file" .faa)
# 提取文件名(不含路径和扩展名)
cp $file faa/$filename.faa
done
# 3.用phylophylan
source activate phylophlan3
# for protein
# 3.1. 设phylophlan参数,得到phylophlan_faa.cfg
phylophlan_write_config_file \
-d a \
-o phylophlan_faa.cfg \
--db_aa diamond \
--map_aa diamond \
--msa mafft \
--trim trimal \
--tree1 iqtree \
--tree2 raxml \
--verbose > log.cfg
# 3.2. 运行phylophlan
phylophlan -i faa -d phylophlan --diversity high -f phylophlan_faa.cfg --nproc 3 -o LWJ_phylophlan_output_faa
# -i 这个是输入文件夹
用时:56个样品,7个小时
软件版本:
prokka 1.13
PhyloPhlAn version 3.1.68
参考
https://mp.weixin.qq.com/s/XqqnsC1TLKiVIdd7dq4l_g
https://www.jianshu.com/p/8cb78c402547
最后的输出文件夹:
中间文件prokka文件夹