关于Kaiju
Kaiju是一款直接通过宏基因组数据Read获得物种注释信息并计算读数与相对丰度的软件。它的主要方法是将Read核酸序列翻译为蛋白序列然后在相应的数据库中进行精确比对,确认物种分类信息。
Kaiju 安装与数据库下载
Kaiju的安装可以参考其Github上给出的步骤。
由于Kaiju的运行需要参考数据库的比对,所以提前要下载好数据库,数据库可以通过kaiju-makedb
命令下载。但是由于我这边不能直接用网关账号登录的服务器进行下载,所以是在组里对外服务器上下载的,可以去Kaiju web server下载,该页面左侧显示了下载链接,复制链接后使用wget
命令就可以下载了。
我下载的数据库是:NCBI BLAST Nr库,下载下来后是tgz格式,用tar xzvf
命令解压就可以了,解压后会得到3个文件:
names.dmp
nodes.dmp
kaiju_db_nr_euk.fmi
这三个文件需要在运行kaiju时指定,存好记下绝对路径就可以了。
Kaiju主程序
kaiju -z 64 -t ~/softwares/kaiju/kaijudb/nodes.dmp \
-f ~/softwares/kaiju/kaijudb/kaiju_db_nr_euk.fmi