prodigal,一款预测原核生物中所有ORF的软件,使用方法简单快捷

Prodigal是一款用于预测原核生物开放阅读框(ORF)的工具,支持单个物种基因组和宏基因组分析。它提供了正常模式、匿名模式和训练模式三种使用方式,适用于快速高效的ORF预测。输出文件包含ORF的详细信息,如起始和终止密码子类型、位置和得分。常用参数包括输入文件、氨基酸序列输出、ORF核酸序列及输出格式设置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

最近使用hmmer时使用到了prodigal,这个工具主要是用来预测原核生物中所有的ORF的,只要将要预测的基因组传入软件即可,不论是单个物种的基因组,还是宏基因组都可以,而且软件计算速度很快,有需要的时候可以用一下呀!


下载以及安装

prodigal可以直接在github上下载发布版本,分别有windows、linux或者os系统的,在linux上下载后解压,再make一下即可(因为我使用make install报错了,但照样能使用)。github链接为https://github.com/hyattpd/Prodigal/releases/tag/v2.6.3

基本使用方式

prodigal的使用方式十分简单,只需要prodigal一个命令即可,简要介绍一下其包含的参数:

项目Value
-i输入文件
-a表示将预测到的ORF全部翻译为氨基酸序列后记录到-a后跟的文件名中
-g选取翻译用的密码子表
-c表示不允许找到的ORF是不具有起始密码或终止密码的(默认是允许的)
-d后面跟找到的所有ORF的核酸序列
-o指定输出文件
-f选取输出格式,默认为gbk格式,还可以选gff,sco等
-h帮助
-m不寻找包含N的序列
-p选择输入单个基因组还是宏基因组(默认为单个)
-q不打印过程
-s将所有潜在的序列都记录下来在-s跟的文件中
-t生成training文件,以便后续类似的预测
-v打印出prodigal的版本
-nBypass Shine-Dalgarno trainer and force a full motif scan(这个不是很懂,和使用到的基序相关)

其中比较常用的应该就是-a、-o、-d、-s这几个参数。

三种使用模式

normal mode

默认使用的模式,根据输入的基因组,从基因组中分析、学习等,再根据得到的特性来预测所有的ORF。

anonymous mode

匿名模式,使用prodigal自带的已经预先计算好的模式来预测ORF

training mode

初次使用时同normal mode,但是使用后可以得到一个训练后得到的文件,下一次预测ORF时可以使用这个文件作为一种模式来预测

输出文件

输出文件中包含的内容主要和找到的序列相关,包含有一个自动生成的ID、其起始密码子的类型,终止密码子的类型,是否同时找到起始和终止密码,以及起始密码和终止密码的位置,gc比值,得分等。如下例(预测的ORF被翻译成蛋白质序列):
在这里插入图片描述
这些信息都比较一目了然,我也就不多介绍了。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值