
BioConductor
文章平均质量分 81
金子哦
教师
展开
-
R语言网络分析2:graph函数和应用
产生网络自定义BioC 中用得最多的网络类型可能是 graphNEL 类。使用 graphNEL 类的同名函数可以产生自定义网络: library(graph) str(graphNEL)#> function (nodes = character(), edgeL = list(), edgemode = "undirected") nds <- letters[1:3] gx1 <- graphNEL(nodes = nds, edgemode =原创 2021-02-22 11:22:15 · 5562 阅读 · 0 评论 -
Affy芯片ATH1-121501探针注释的处理
BioC有Affy芯片ATH1-121501(GPL198平台)的注释库文件(R包),芯片分析后期处理经常要使用,导出方法如下。先安装BioC的ath1121501.db包:library("BiocInstaller")biocLite("ath1121501.db")使用plyr揉数据包整理探针id和AGI:library(ath1121原创 2017-12-04 07:39:37 · 5326 阅读 · 0 评论 -
Bioconductor软件安装与升级
本文已于2019.07.12按新版Bioconductor安装包BiocManager出现的问题进行更新。1 修改安装软件源BioConductor安装需要下载很多文件,如果不修改,程序很可能是从国外网址下载,速度较慢,修改后可加快下载和安装速度。Debian类系统可修改 /etc/R/Rprofile.site 文件,找到respos选项修改部分,按需修改成所使用的源。例如:...原创 2017-03-17 11:32:08 · 39575 阅读 · 9 评论 -
使用oligo软件包处理芯片数据
本博客介绍过 Affy芯片的处理方法 ,其中所使用的软件包有一定的局限性,无法读取和分析一些新版Affy芯片。本文介绍oligo软件包的处理方法以解决这些问题。oligo软件包并不是新出现的软件包,只因新类型芯片的不断推出,关注它的用户越来越多。而且,除了用于Affy芯片处理外,oligo软件包还可处理NimbleGen芯片。oligo处理芯片的原理和其他方法相同,难点在最后一步:从探针到原创 2017-03-27 18:15:10 · 24437 阅读 · 2 评论 -
R/BioC序列处理之五:Rle和Ranges
生物序列信息不仅仅指序列本身,它们还包括其他类型的信息,如基因都定位在哪些序列(染色体)上,正链还是负链,什么位置,其他数据库对应的编号是什么,有什么功能等等。下面介绍BioC中用于这些数据存储和处理的Rle和Ranges类。Table of Contents1 Rle(Run Length Encoding,行程编码)1.1 Rle类和Rle对象1.2 Rle对象的处理方法原创 2014-04-23 16:21:57 · 9111 阅读 · 1 评论 -
使用BioC软件包分析qPCR数据
BioC中有关qPCR分析的软件包有: HTqPCR, ddCt 和 qpcrNorm。其中HTqPCR软件包可用于Ct值分析,其功能包括:数据读取, 质量分析,归一化处理,数据可视化,feature(基因或miRNA)间Ct值的参数或非参数检验等,并引入limma的方法对多组试验之间的差异进行显著性检验,基本的统计分析功能都具备了。ddCt软件包能使用多内参基因计算基因表达量,和HTqPCR包配原创 2014-04-23 16:22:45 · 13273 阅读 · 0 评论 -
在R中使用Primer3和NCBI-BLAST进行高通量引物设计
无论是芯片实验还是深度测序,高通量数据分析后都需要进行实验验证,其中PCR是必不可少的。PCR引物设计方法和软件很多,选用哪种完全取决于个人习惯和好恶,没有对错,唯一标准就是能否完成实验。这里我们用R语言整合Primer3和NCBI-BLAST进行批量引物设计。1 Primer3 使用简介Primer3 是PCR引物设计软件,Debian下可以直接使用新立得查找安装或者用apt-get安原创 2014-04-23 16:22:05 · 10777 阅读 · 1 评论 -
R/BioC序列处理之四:BSgenome简介
一、BSgenome和BSgenome数据包 Bioconductor提供了某些物种的全基因组序列数据包,这些数据包是基于Biostrings构建的,称为BSgenome数据包。不同物种的BSgenome数据包都有类似的数据结构,可以用统一的方式进行处理。但是BSgenome数据包仅包含有数据,它们的处理的方法由另外一个软件包提供,即BSgenome包。先安装BSgenome包(如果没有安装):原创 2014-04-23 16:21:52 · 6545 阅读 · 2 评论 -
R/BioC序列处理之三:Biostrings模式匹配和序列比对
Biostrings最后一节,介绍模式匹配和序列比对的相关函数和操作。下面我们使用拟南芥基因转录起始点上游1kb的序列进行分析。序列文件可以从TAIR网站(http://www.arabidopsis.org)下载。先用readDNAStringSet函数从FASTA文件中读取序列并查看头2个序列的信息:library(Biostrings)upstream.1k readDNAString原创 2014-04-23 16:21:49 · 12288 阅读 · 1 评论 -
R/BioC序列处理之二:Biostrings序列的基本操作
还是先获取随机DNA序列和其他序列对象:library(Biostrings)rndSeq function(dict, n) { paste(sample(dict, n, replace = T), collapse = "")}set.seed(0)# 用mapply和rndSeq函数获取5条序列(字符串):DNA.raw mapply(rndSeq, list(DNA_原创 2014-04-23 16:21:47 · 12406 阅读 · 1 评论 -
R/BioC序列处理之一:Biostrings常量与序列容器
序列说到底就是文本/字符串类型的数据,你完全可以用纯纯的R base函数来处理,只是太麻烦,而且效率很低。BioC的IRanges包从数据结构和运算规则等角度对生物序列做了很细致的定义,是使用R高效处理生物序列数据的基础。但是IRanges包定义的类和方法(函数)实在太多了,学习起来很乏味,有空自己啃吧。我们从Biostrings包开始。一、用R base的函数来处理序列先写一个用于产生随机D原创 2014-04-23 16:21:45 · 9036 阅读 · 2 评论