逐行读取文本
open FH,"1.txt";
while(<FH>) #逐行读取文本
{
print $_;
}
1、输入物种名 拿到tax id
https://www.ncbi.nlm.nih.gov/Taxonomy/TaxIdentifier/tax_identifier.cgi

例如西瓜:

2、NCBI下载gene2go.gz
ftp://ftp.ncbi.nih.gov/gene/DATA/

3、下载
关于这个taxid的资料还有很多
链接: ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/.
其中我们可以下载
wget ftp://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz
这个文件,解压可以看到里面有以下文件,其中比较重要的两个文件
nodes.dmp 这个文件列出了taxid的树的结构信息,子节点,父节点等等
names.dmp 这个文件里面列出了每个独特的taxid对应着的物种名

本文详细记录了如何从NCBI获取特定物种的Tax ID,通过输入物种名,下载gene2go.gz文件,并介绍了相关资源,包括nodes.dmp和names.dmp文件的内容,这些文件对于理解物种的Taxonomy树结构和物种名称至关重要。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



