R-下载某一条通路的所有基因名字(KEGG)

KEGG数据库多巴胺通路基因提取

实例:如何拿到KEGG数据库中多巴胺通路相关的基因集

一、确定目标通路

打开KEGG选择pathway,在搜索框前输入物种,框内填入关键词。

筛选结果显示仅有hsa04728符合我们的研究目的

二、下载hsa04728通路中的全部基因

##1.安装R包KEGGREST
首次安装时电脑可能会显示与当前R语言版本不配,可以从bioconductor 的官网下载安装

if(!requireNamespace("BiocManager", quietly = TRUE))      
   install.packages("BiocManager") 
BiocManager::install("KEGGREST", version = "3.10") 

可以library一下这个包,里面包含了KEGG数据库的19个子数据库
,“pathway”、“genes” 、“ligand”、 "brite"为4个主要的数据库,其他的子数据库是在这4个数据库的基础上衍生出来的。

> library("KEGGREST") 
> listDatabases()  
[1] "pathway"  "brite"    "module"   "ko"       "genome"   "vg"       
[7] "ag"       "compound" "glycan"   "reaction" "rclass"   "enzyme"  
[13] "disease"  "drug"     "dgroup"   "environ"  "genes"    "ligand"  
[19] "kegg"  
  • "pathway"数据库提供发生在细胞内各种反应的人工绘制途径图,以网络形式-呈现。“genes” 数据库存储KEGG中注册的已经测序的基因组信息。
  • "ligand"数据库可以查询化合物、多糖以及酶促反应等信息。
  • "brite"是将生物信息按等级层次分类归纳的数据库,其中所包含的KEGG、KO是用于同源性识别的系统。
    #2.提取通路信息
keggGet('hsa04728') 
gs<-keggGet('hsa04728')
  • 使用 keggGet 函数获取人类基因信号通路 hsa04650 的信息,并缓存
    逐步run可以看到结果包括了通路介绍、基因,基因间的联系方式,以及链接等等。

三.提取全部基因

#获取通路中gene信息 
gs[[1]]$GENE 
#查找所有基因 
genes<-unlist(lapply(gs[[1]]$GENE,function(x) strsplit(x,';'))) 
genelist <- genes[1:length(genes)%%3 ==2] 
genelist <- data.frame(genelist)  
#把结果写入表格中 
write.table(genelist, "C:\\Users\\xxx\\Desktop\\hsa04728.csv",            
row.names=FALSE,col.names=TRUE,sep=",") 

最终可以获得一个表格,genelist中有132个基因name,即多巴胺通路hsa04718中涉及的所有的基因。

资源下载链接为: https://pan.quark.cn/s/9e7ef05254f8 KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库是一个集成了基因、化学物质及生物系统路径信息的综合性数据库,涵盖了生物体内的代谢通路和信号通路等信息,广泛应用于基因功能、代谢及基因表达调控研究。其中,KEGG还专门提供了癌症相关路径信息,为癌症研究提供了极大便利。 若要从KEGG数据库中获取癌症相关Pathway的基因集,可按以下步骤操作:首先,访问KEGG官方网站或合作网站。需注意,文中提到的网址有误,正确的网址应为。接着,注册或登录账号,这一步骤用于身份验证,同时便于数据库管理者跟踪用户活动,维护数据库更新。然后,在搜索框中输入特定癌症名称,如“Prostate”(前列腺癌),点击搜索按钮,KEGG会返回包含相关癌症路径信息的结果列表。在搜索结果页面底部,筛选出符合“KEGG_XXX_CANCER”格式的条目,其中XXX代表不同癌症类型,这些条目包含与指定癌症相关的代谢通路、信号通路等信息。点击相关条目进入详情页,可查看特定癌症路径的详细描述及基因信息,并按需选择合适格式下载基因集,下载基因集通常以文本形式呈现,便于后续分析。下载后,可使用文本编辑器查看基因集文件,文件中包含与特定癌症路径相关的基因列表,研究者可据此开展生物信息学分析、统计检验等。由于文档信息来源于OCR扫描,可能存在识别错误和遗漏,使用时需结合上下文及专业知识进行合理推断和校正。在实际操作中,需注意版权和使用许可问题,遵守相关法律法规及数据库使用条款。进行癌症研究时,获取和使用基因集应遵循伦理准则及隐私保护相关规定。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值