目录
简介
在网上看到很多文章,都是在介绍如何通过在线工具获取miRNA的靶基因,为了优化流程,将识别环节也进行标准化处理,在本地运行,本人研究了这个库。
multiMiR
是一个集成了多个microRNA靶基因数据库的R包,它包含了验证过的microRNA靶基因数据库(如miRecords、miRTarBase和TarBase)、预测的microRNA靶基因数据库(如DIANA-microT、ElMMo、MicroCosm等)以及microRNA疾病/药物数据库(如miR2Disease、Pharmaco-miR VerSe和PhenomeriR)。这个包提供了一个统一的接口来查询和分析microRNA靶基因及其与疾病和药物的关联。下面内容是multiMiR
包的快速使用的教程。
安装和依赖
在开始之前,请确保您的R环境中已经安装了BiocManager
。如果没有,您可以通过以下命令安装:
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
然后,使用BiocManager
安装multiMiR
包:
BiocManager::install("multiMiR")
快速入门
1. 载入包
首先,载入multiMiR
包:
library(multiMiR)
2. 查询microRNA靶基因
multiMiR
的主要功能是get_multimir()
函数,它允许用户检索预测和验证的microRNA靶基因相互作用及其与疾病和药物的关联。以下是如何使用这个函数的基本示例:
# 查询人类(hsa)中hsa-miR-18a-3p的验证靶基因
result <- get_multimir(mirna = 'hsa-miR-18a-3p', org = 'hsa', table = 'validated')
mirna
详解解释如下:
“‘NULL’(默认值)或者一个成熟miRNA的字符字符串或字符向量。
它可以是成熟miRNA的访问号(例如"MIMAT0000072”),成熟miRNA ID(例如"hsa-miR-199a-3p"),或者两者的组合(例如c(“MIMAT0000065”, “hsa-miR-30a-5p”))。字符是大小写不敏感的。*参见关于支持列表长度的注释。"
此外,mirna
参数也支持列表格式。比如可以将DESeq得到的差异miRNA名称列输入到参数中。
org
目前数据库仅支持人(hsa),小鼠(mmu)还有大鼠(rno),其他物种暂不支持。
3. 查看结果
get_multimir()
返回一个S4对象,其中包含了查询数据和相关的元数据。这个格式不太方便转换为数据框,但可以使用@
操作符来访问这些数据:
# 查看数据
head(result@data)
# 查看摘要信息
result@summary
4. 过滤和选择数据
您可以使用select()
函数来过滤和选择特定的数据列:
# 选择特定列
selected_data <- select(result, columns = c("mature_mirna_id", "target_symbol"))
head(selected_data)
5. 查询疾病和药物关联
multiMiR
也可以用来查询与特定疾病或药物相关的microRNA:
# 查询与“cisplatin”相关的microRNA
drug_result <- get_multimir(disease.drug = 'cisplatin', table = 'disease.drug')
head(drug_result@data)
6. 列出数据库中的microRNA、基因、药物和疾病
如果您想要了解multiMiR
数据库中包含哪些microRNA、基因、药物和疾病,可以使用list_multimir()
函数:
# 列出前10个microRNA
miRNAs <- list_multimir("mirna", limit = 10)
head(miRNAs)
# 列出前10个基因
genes <- list_multimir("gene", limit = 10)
head(genes)
高级用法
1. 切换数据库版本
multiMiR
允许切换到不同的数据库版本:
# 查看可用的数据库版本
db_versions <- multimir_dbInfoVersions()
db_versions
# 切换到特定版本
multimir_switchDBVersion(db_version = "2.0.0")
截止到文章发布,最新版本是2.4.0
2. 直接查询数据库
对于高级用户,multiMiR
提供了直接使用SQL查询数据库的功能:
# 直接执行SQL查询
query <- "SELECT * FROM mirna WHERE mature_mirna_id = 'hsa-miR-18a-3p'"
direct_result <- search_multimir(query)
head(direct_result)
结果展示
这是我通过multiMiR
得到的结果,采用的csv格式,后续可以通过target_symbol
列进行GO和kegg功能注释
结论
multiMiR
是一个强大的工具,它为研究者提供了一个方便的接口来探索microRNA靶基因及其与疾病和药物的关联。通过这个快速使用教程,您应该能够开始使用multiMiR
来进行您自己的分析。更多高级功能和详细用法,请参考multiMiR
的官方文档和用户指南。
欢迎通过下方微信公众号加入社区交流,或者在文章下方留言,我会及时回复。