RNA-RNA相互作用预测的网络服务
在生物信息学领域,RNA-RNA相互作用(RRI)的研究至关重要。本文将为大家介绍多种用于RRI预测的网络服务工具,包括它们的特点、输入输出要求以及使用方法。
1. 工具概述
首先,我们来看一些常见的RRI预测工具,如下表所示:
| 方法 | 关键词 |
| ---- | ---- |
| LncRRIsearch | LncRNAs |
| RILogo | 可视化RRIs |
| psRNATarget | 植物小非编码RNA,可及性 |
| Snoscan | C/D盒snoRNAs |
| snoGPS | H/ACA snoRNAs |
| pirScan | 秀丽隐杆线虫piRNAs |
这些工具可大致分为几类:联合结构预测工具、局部(全局)相互作用预测工具、核酸设计工具以及针对特定RNA类别的预测工具。接下来,我们将详细介绍其中一些代表性的网络服务。
2. IntaRNA和CopraRNA
-
工具特点
- IntaRNA是一种用于一般RRI预测的局部相互作用预测工具,基于杂交能量和可及性两个分数进行相互作用预测。杂交能量是两个RNA杂交产生的稳定能量,可及性表示形成内部RNA二级结构的难易程度,即与外部RNA形成相互作用的容易程度。不过,由于计算时间长,IntaRNA仅适用于短RNA。
- CopraRNA通过整合IntaRNA对多个基因组序列的预测结果来预测微生物sRNA靶标,采用比较基因组学方法,其预测性能比IntaRNA更高。
-
输入要求
- IntaRNA的主要输入是两种RNA:查询RNA和靶标RNA。查询RNA应为多FASTA格式的短RNA,靶标RNA长度可达数百个碱基。用户可以使用多FASTA格式或原核基因组的Refseq ID指定靶标RNA。若使用Refseq ID,由于IntaRNA无法处理整个基因组作为输入,起始或终止密码子周围的RNA序列将被视为靶标RNA,具体细节可由用户配置。此外,用户还可以调整各种运行时参数,如每个RNA对的相互作用数量、最大相互作用长度、G - U摆动碱基对的处理以及RNA二级结构分析的能量模型。
- CopraRNA仅接受多FASTA格式的查询RNA和Refseq ID作为靶标RNA输入。用户需要指定3到8个Refseq ID进行比较基因组分析,并选择一个生物体作为主要靶标。
-
输出结果
- IntaRNA的输出形式多样,最重要的结果是对预测相互作用的详细描述,包括相互作用区域、碱基对和相互作用得分。当用户使用多FASTA格式指定靶标RNA时,会提供位置最小能量分布图,显示可能相互作用的RNA区域;当使用Refseq ID指定靶标RNA时,会提供查询和靶标RNA中相互作用区域的汇总图,还会提供预测靶标的功能富集分析热图。
- CopraRNA的输出与IntaRNA类似。
以下是IntaRNA的使用流程:
graph LR
A[准备查询RNA(多FASTA格式短RNA)] --> B[准备靶标RNA(多FASTA格式或Refseq ID)]
B --> C[调整运行时参数(可选)]
C --> D[运行IntaRNA]
D --> E[获取输出结果(相互作用描述、能量分布图等)]
3. RNAup和RNAcofold
-
工具特点
- RNAup是一种局部相互作用预测工具,与IntaRNA类似,利用杂交能量和可及性进行预测,预测性能与IntaRNA相当,但计算时间更长。
- RNAcofold是一种联合结构预测工具,使用基于串联的算法,计算两个输入RNA串联序列的最小自由能结构,预测速度较快,但预测性能低于IntaRNA和RNAup。
-
输入要求
- RNAup和RNAcofold都只接受单FASTA格式的两个输入RNA序列,并且都允许用户设置一些可选参数,如RNAup可设置非结构化区域的长度和孤立碱基对的处理,RNAcofold也有相应的可选参数。
-
输出结果
- RNAup的主要结果是带有结合能的预测相互作用,还会提供较长序列的位置杂交能量和位置可及性图。
- RNAcofold会显示RNA之间的预测相互作用以及两个RNA的内部结构,并提供两个RNA的碱基配对概率。
4. TargetScan
-
工具特点
- TargetScan是一种用于多种动物物种的miRNA靶标预测工具。在动物中,miRNA发挥功能时,全长不需要与靶标区域互补,但6 - 8个碱基的种子区域必须形成完全互补区域。种子区域是指miRNA 5’端第二个核苷酸位置开始的区域。此外,TargetScan使用保守指数作为相互作用预测的有用特征,还使用14种RNA特征(如可及性、3’ - UTR长度和相互作用位点附近的AU含量)进行高精度预测,这些特征是基于74个微阵列数据集使用逐步回归模型选择的。
-
使用方法
- 用户首先需要选择靶标物种,目前支持13种动物,包括人类、小鼠、大鼠等。
- 然后指定靶标RNA或miRNA,靶标基因/转录本可以使用基因符号或ENSEMBL基因/转录本ID指定,靶标miRNA可以直接输入名称或从选项卡中选择。
-
输出结果
- 当用户指定靶标RNA作为输入时,TargetScan会输出预测与转录本3’ - UTR结合的miRNA列表,还会显示物种间转录本的多序列比对,以确认种子区域相互作用区域的保守性。
- 当用户指定miRNA作为输入时,会输出预测的靶标转录本列表,列表中包含对应基因的Ensemble注释页面的超链接,方便用户研究靶标基因功能。
5. Snoscan和snoGPS
-
snoRNAs简介
- snoRNAs是一类小非编码RNA家族,通过与靶标RNA的碱基配对RRI介导其他非编码/编码RNA的几种类型的RNA修饰,主要包括核糖2’ - O甲基化和尿苷的假尿苷化。snoRNAs与多种蛋白质(包括甲基转移酶和假尿苷合成酶等修饰酶)相互作用,形成snoRNPs(小核仁核糖核蛋白复合物)。其主要靶标RNA是四种核糖体RNA(rRNAs),已鉴定出100多个修饰位点。snoRNAs可分为C/D盒型(核糖2’ - O甲基化)和H/ACA盒型(假尿苷化)。
-
Snoscan
- 工具特点 :是一种用于预测C/D盒型snoRNAs和rRNA中靶标位点修饰的网络服务,基于检测盒C和D序列、二级结构以及snoRNA与rRNA之间的RRI。
- 输入要求 :用户需要准备候选snoRNA序列和靶标RNA序列作为输入数据,对于靶标RNA序列,Snoscan还提供了几种物种(如人类、小鼠、果蝇和蠕虫)的rRNA序列作为替代输入数据。此外,用户需要指定系统发育组(哺乳动物、酵母、古细菌)以应用合适的预测模型,还可以指定一些搜索选项,如snoRNA与rRNA之间RRI的长度和盒C与D之间的距离,以控制预测结果。
- 输出结果 :包含多种信息,如snoRNA与靶标RNA之间的RNA - RNA碱基配对相互作用、盒序列的位置、snoRNA二级结构的茎区域以及靶标RNA序列中的甲基化位点/位置。
-
snoGPS
- 工具特点 :用于预测H/ACA snoRNAs和靶标RNA中修饰位点的网络服务,基于这些RNA的二级结构、RRI以及盒序列。
- 输入要求 :用户需要准备候选H/ACA snoRNA序列和靶标RNA序列,snoGPS仅为人类和酵母提供rRNA序列作为替代输入数据。用户还需要指定输入序列的系统发育组(人类、酵母和古细菌),并且需要指定搜索模式(一个或两个茎),“一个茎”模式适用于几种古细菌snoRNAs,“两个茎”模式适用于预测由两个发夹组成的真核生物snoRNAs。
- 输出结果 :提供靶标RNA中的假尿苷化位点、snoRNA与靶标RNA之间的RRI、发夹结构和盒序列等信息。
6. CRISPRdirect
-
CRISPR - Cas9系统简介
- CRISPR - Cas9系统是生物研究中最流行的基因组DNA编辑工具之一,常用于基因敲除实验。在该系统中,单引导RNA(gRNA)基于RNA - DNA碱基配对相互作用设计用于位点特异性DNA编辑,导致Cas9核酸内切酶精确切割DNA。gRNA长度约为100 nt,其5’端的前20 nt序列需要与靶标DNA序列互补,靶标DNA序列应与原间隔序列相邻基序(PAM)相邻,PAM被Cas9识别并在其上游3 nt处切割。
-
CRISPRdirect工具
- 工具特点 :是一种帮助用户设计gRNA序列的网络服务,通过在用户定义的序列(如敲除靶标基因)中搜索带有20个碱基DNA序列的PAM。
- 输入要求 :用户需要准备被CRISPR - Cas9靶向的DNA序列或指定其登录号(RefseqID)或基因组坐标,还需要指定PAM序列以适应实验中使用的Cas9类型。为了检查靶标DNA序列在参考基因组中的特异性,需要指定基因组序列,目前支持600多种参考基因组。
- 输出结果 :结果列表包括带有PAM的候选靶标序列(20个碱基)的位置以及在参考基因组序列中检测到的靶标位点数量,还会显示候选靶标序列的12个碱基和8个碱基子序列的数量,用于估计脱靶效应。“仅显示高度特异性靶标”复选框有助于找到脱靶效应小的靶标序列,图形视图提供候选靶标位点的位置和链的可视化。
7. LncRRIsearch
-
工具特点
- LncRRIsearch是一个搜索/存储人类和小鼠中预测的长非编码RNA(lncRNA) - RNA相互作用的网络服务/数据库,相互作用基于RIblast预测的局部稳定相互作用。为了缩小候选RRI的范围,LncRRIsearch结合了两种实验信息:表达和亚细胞定位。该服务器仅接受lncRNA作为查询RNA,在搜索过程中接受mRNA和lncRNA作为靶标RNA。
-
搜索模式
- 按名称或ID搜索 :用户可以通过基因/转录本名称或ID搜索RRI,可指定的参数包括物种(“人类”和“小鼠”)和相互作用能量的能量阈值( - 16和 - 12 kcal/mol)。例如,选择“人类”作为物种,“ - 16 kcal/mol”作为能量阈值,并将“NEAT1”作为查询,服务器将返回NEAT1与其他转录本之间相互作用能量小于 - 16 kcal/mol的RRI。用户还可以选择转录本变体作为查询RNA。
- 按表达模式搜索 :查询/靶标转录本的表达模式是缩小RRI范围的有用指标。用户可以使用查询和靶标RNA的表达模式搜索RRI,可指定的参数包括“物种”(人类或小鼠)、“能量阈值”、“RNA - seq研究”(五项研究)、“组织”和“表达模式”,表达模式包括“lncRNA上调靶标上调”、“lncRNA上调靶标下调”和“lncRNA下调靶标上调”。例如,选择“大脑”作为组织,“lncRNA上调,靶标上调”作为表达模式,LncRRIsearch将返回lncRNA在大脑中特异性上调且其靶标RNA也特异性上调的lncRNA - RNA相互作用列表。
- 按lncATLAS RCI搜索 :亚细胞定位是缩小RRI的另一个指标,因为只有位于同一位置的RNA才有机会相互作用。用户可以在考虑查询和靶标转录本定位的同时搜索RRI,可指定的参数包括“能量阈值”、“细胞系”(15种细胞系之一)、“RCI”(相对浓度指数)类型(细胞质/细胞核或细胞核/细胞质)和“RCI阈值”。例如,选择“CN - RCI”作为RCI,“A549”作为细胞系,“2”作为RCI阈值,服务器将返回在A549细胞系中靶标和查询转录本的CN - RCI均大于2的RRI列表。
-
输出结果
- 搜索后,用户将获得查询和靶标RNA/转录本的基因组位置,并带有UCSC基因组浏览器的链接。
- 还会显示查询/靶标序列在几种组织中的表达模式和亚细胞定位。
综上所述,这些网络服务工具为RNA - RNA相互作用的研究提供了强大的支持,不同的工具适用于不同的研究需求,研究人员可以根据具体情况选择合适的工具进行分析。
RNA-RNA相互作用预测的网络服务
各工具对比总结
为了让大家更清晰地了解这些工具的特点和适用场景,下面对上述介绍的工具进行一个对比总结:
| 工具名称 | 工具类型 | 适用RNA类型 | 输入要求 | 主要特点 | 输出结果 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| IntaRNA | 局部相互作用预测工具 | 一般RNA | 查询RNA(多FASTA格式短RNA)、靶标RNA(多FASTA格式或Refseq ID),可调整运行时参数 | 基于杂交能量和可及性预测,适用于短RNA,计算时间长 | 相互作用详细描述、位置最小能量分布图、相互作用区域汇总图、功能富集分析热图 |
| CopraRNA | 微生物sRNA靶标预测工具 | 微生物sRNA | 多FASTA格式查询RNA、Refseq ID靶标RNA,需指定3 - 8个Refseq ID进行比较基因组分析并选主要靶标 | 整合IntaRNA对多基因组序列的预测结果,采用比较基因组学方法,预测性能高 | 与IntaRNA类似 |
| RNAup | 局部相互作用预测工具 | 一般RNA | 单FASTA格式两个输入RNA序列,可设置可选参数 | 利用杂交能量和可及性预测,预测性能与IntaRNA相当,计算时间长 | 带结合能的预测相互作用、位置杂交能量和位置可及性图 |
| RNAcofold | 联合结构预测工具 | 一般RNA | 单FASTA格式两个输入RNA序列,可设置可选参数 | 使用基于串联的算法,预测速度快,预测性能低于IntaRNA和RNAup | RNA间预测相互作用、内部结构、碱基配对概率 |
| TargetScan | miRNA靶标预测工具 | miRNA | 选择靶标物种,指定靶标RNA(基因符号或ENSEMBL基因/转录本ID)或miRNA(名称) | 利用种子区域互补、保守指数和14种RNA特征进行高精度预测 | 预测结合的miRNA列表、转录本多序列比对、预测的靶标转录本列表及超链接 |
| Snoscan | C/D盒型snoRNA预测工具 | C/D盒型snoRNA、rRNA | 候选snoRNA序列、靶标RNA序列(部分物种有rRNA替代数据),指定系统发育组和搜索选项 | 基于盒C和D序列、二级结构及RRI预测 | RNA - RNA碱基配对相互作用、盒序列位置、茎区域、甲基化位点/位置 |
| snoGPS | H/ACA snoRNA预测工具 | H/ACA snoRNA、rRNA | 候选H/ACA snoRNA序列、靶标RNA序列(人类和酵母有rRNA替代数据),指定系统发育组和搜索模式 | 基于二级结构、RRI及盒序列预测 | 假尿苷化位点、RRI、发夹结构、盒序列 |
| CRISPRdirect | gRNA设计工具 | 无 | DNA序列或其登录号、基因组坐标,指定PAM序列和参考基因组 | 搜索PAM和20 - mer DNA序列,帮助设计gRNA | 候选靶标序列位置、靶标位点数量、子序列数量、图形视图 |
| LncRRIsearch | lncRNA - RNA相互作用搜索工具 | lncRNA、mRNA、lncRNA | 按不同搜索模式指定相应参数,如物种、能量阈值、表达模式、细胞系等 | 结合表达和亚细胞定位信息缩小候选RRI范围 | 基因组位置链接、表达模式和亚细胞定位信息 |
实际应用案例分析
下面通过几个实际应用案例,进一步说明这些工具在生物研究中的作用。
案例一:研究miRNA与靶标基因的相互作用
研究人员想要探究人类miR - 9 - 5p的靶标基因。他们使用TargetScan工具,具体操作步骤如下:
1. 打开TargetScan网站,选择“人类”作为靶标物种。
2. 在输入框中直接输入“miR - 9 - 5p”。
3. 点击搜索按钮,服务器返回预测的靶标转录本列表。研究人员通过列表中的超链接访问Ensemble注释页面,对靶标基因的功能进行深入研究,发现这些靶标基因可能参与了神经系统发育等重要生物学过程。
案例二:设计CRISPR - Cas9系统的gRNA
在进行基因敲除实验时,研究人员需要为某个特定基因设计gRNA。他们使用CRISPRdirect工具,操作流程如下:
1. 准备好该基因的DNA序列,或者获取其RefseqID或基因组坐标。
2. 根据实验中使用的Cas9类型,指定相应的PAM序列,如使用来自酿脓链球菌的Cas9,则指定PAM为“NGG”。
3. 选择合适的参考基因组,如人类基因组。
4. 提交输入信息,CRISPRdirect会搜索PAM和20 - mer DNA序列。结果列表显示了带有PAM的候选靶标序列的位置和靶标位点数量,研究人员通过查看12 - mer和8 - mer子序列数量来评估脱靶效应,使用“仅显示高度特异性靶标”复选框筛选出脱靶效应小的靶标序列,最终设计出合适的gRNA用于后续实验。
未来发展趋势
随着生物信息学技术的不断发展,RNA - RNA相互作用预测的网络服务工具也将不断完善和发展。未来可能会出现以下几个发展趋势:
精度提升 :通过整合更多的实验数据和生物信息学特征,如蛋白质 - RNA相互作用信息、RNA的三维结构信息等,进一步提高预测工具的准确性和可靠性。
功能拓展 :开发更多的功能,例如支持更多物种的预测、提供更详细的可视化结果、增加对RNA - 蛋白质复合物相互作用的预测等,以满足不同研究领域的需求。
易用性增强 :优化用户界面和操作流程,使工具更加易于使用,降低研究人员的使用门槛,让更多的非专业人士也能方便地进行RNA - RNA相互作用的研究。
多工具整合 :将不同类型的预测工具进行整合,形成一个综合性的平台,用户可以在一个平台上完成多种类型的RNA - RNA相互作用分析,提高研究效率。
总结与建议
RNA - RNA相互作用预测的网络服务工具为生物研究提供了重要的支持,不同的工具具有不同的特点和适用范围。研究人员在选择工具时,应根据研究的具体需求,如研究的RNA类型、实验目的、数据特点等,综合考虑工具的性能、输入输出要求和易用性等因素。
在使用这些工具时,建议研究人员仔细阅读工具的使用说明和文档,了解每个工具的参数设置和注意事项,以获得更准确和可靠的结果。同时,结合实验验证来进一步确认预测结果的准确性,将生物信息学预测与实验研究相结合,推动RNA - RNA相互作用研究的深入发展。
希望本文介绍的这些工具和相关信息能够帮助广大生物研究人员更好地开展RNA - RNA相互作用的研究工作,为生物科学的发展做出贡献。
以下是选择合适工具的决策流程图:
graph LR
A[确定研究的RNA类型] --> B{是miRNA吗}
B -- 是 --> C[使用TargetScan]
B -- 否 --> D{是snoRNA吗}
D -- 是 --> E{是C/D盒型吗}
E -- 是 --> F[使用Snoscan]
E -- 否 --> G[使用snoGPS]
D -- 否 --> H{是CRISPR - Cas9相关吗}
H -- 是 --> I[使用CRISPRdirect]
H -- 否 --> J{是lncRNA吗}
J -- 是 --> K[使用LncRRIsearch]
J -- 否 --> L{是短RNA吗}
L -- 是 --> M[考虑IntaRNA或RNAup]
L -- 否 --> N[考虑RNAcofold或CopraRNA(微生物sRNA情况)]
通过这个流程图,研究人员可以根据研究的RNA类型快速定位到合适的预测工具,提高研究效率。
超级会员免费看
1万+

被折叠的 条评论
为什么被折叠?



