如何使用R包进行KEGG和GO分析

先贴上代码,后面有空的时候来解释:

source("http://bioconductor.org/biocLite.R");biocLite("clusterProfiler")
biocLite("clusterProfiler")
getwd()
setwd("E:/my project/R_project")
library(org.Hs.eg.db)
data(geneList, package="DOSE")
gene <- names(geneList)[abs(geneList) > 2]
gene.df <- bitr(gene, fromType = "ENTREZID",
        toType = c("ENSEMBL", "SYMBOL"),
        OrgDb = org.Hs.eg.db)

#GO analyse
ego_cc <- enrichGO(gene = gene,
                   OrgDb=org.Hs.eg.db,
                   ont = "CC",
                   pAdjustMethod = "BH",
                   minGSSize = 1,
                   pvalueCutoff = 0.01,
                   qvalueCutoff = 0.01,
                   readable = TRUE)
write.table(as.data.frame( ego_cc@result), file="test_CC.txt")
barplot(ego_CC, showCategory=15,title="EnrichmentGO_CC")#条状图,按p从小到大排的

#KEGG analyse
kk <- enrichKEGG(gene = gene,
                 organism ="human",
                 pvalueCutoff = 0.01,
                 qvalueCutoff = 0.01,
                 minGSSize = 1,
                 #readable = TRUE ,
                 use_internal_data =FALSE)
write.table(as.data.frame(kk@result), file="test_kk.txt")

 

### R语言中的GOKEGG富集分析 #### 数据准备 为了在R中执行GOKEGG富集分析,数据通常需要经过预处理阶段。这涉及收集基因列表并将其转换成适合用于富集分析的形式。可以利用Excel来整理这些初步的数据文件[^1]。 #### 安装必要的 要开始GOKEGG富集分析,在R环境中安装几个重要的库是必不可少的: ```r if (!requireNamespace("BiocManager", quietly = TRUE)) install.packages("BiocManager") BiocManager::install(c("clusterProfiler", "org.Hs.eg.db")) ``` #### 加载所需的库 一旦上述被成功安装,下一步就是加载它们以便后续操作能够顺利进行: ```r library(clusterProfiler) library(org.Hs.eg.db) ``` #### 执行富集分析 下面是一个简单的例子展示如何使用`enrichGO()`函数来进行GO术语上的富集测试;对于KEGG路径,则可采用类似的逻辑调用相应的API接口如`enrichKEGG()`: ```r # 假设我们有一个差异表达基因(DEGs) ID 列表 deg_ids <- c("7089", "5643", ...) ego <- enrichGO(gene = deg_ids, universe = keys(org.Hs.eg.db, keytype="ENTREZID"), OrgDb = org.Hs.eg.db, ont = "BP", pAdjustMethod= "BH", qvalueCutoff = 0.05) ekg <- enrichKEGG(gene = deg_ids, organism = 'hsa', pAdjustMethod= "BH", qvalueCutoff = 0.05) ``` 以上代码片段展示了基本的工作流程,其中含了设置参数以调整p值的方法(这里选择了Benjamini-Hochberg校正),以及指定显著性的阈值(q-value cutoff)。 #### 结果可视化 最后一步是对获得的结果进行解释呈现。ClusterProfiler提供了多种绘图选项帮助理解所得结论: ```r dotplot(ego, showCategory=20) barplot(ego, showCategory=20) cnetplot(ego, categorySize='medium') ``` 通过这种方式,不仅可以直观地看到哪些生物过程受到了影响,还可以进一步探索不同类别之间的关系网络结构。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值