- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 主成份分析以及R语言
>library(mvstats)> X2> dim(X2)[1] 13 18> PCA2Error in princomp.default(X2) : 'princomp' can only be used with more units than variables> PCA2> summary(PCA2)Importance of components
2016-06-24 10:29:31
2534
1
原创 数据预处理——以GSE3494为例
1、数据读取1)读取excel文件——GEO中Series Matrix File(s)是预处理过的基因表达矩阵,用excel打开删掉注释信息,获得行为探针,列为样本的基因表达矩阵。read.table(),read.csv(),read.delim()直接读取EXCEl文件时,都会遇到一下问题:“在读取‘.xls’的TableHeader时遇到不完全的最后一行”。解决的方法有
2016-04-06 11:30:39
28536
转载 解决——Matlab中文显示乱码
Setting User Locale on Windows 7 PlatformsSelect Start -> Control Panel -> Clock, Language, and Region -> Regional and Language.Open Formats tab.Select a target locale from the For
2015-07-30 12:30:56
1096
原创 GSE2603基于R语言对乳腺癌转移的数据挖掘
乳腺癌是以局部病变为首发症状的全身性疾病,肿瘤细胞转移生物学过程的复杂性,决定了从基因组水平蹄选与转移表型相关的功能基因成为目前乳腺癌转移预后相关基因研究的主要途径。通常是比较转移与不转移的细胞系,或同一细胞系的高转移与低转移的亚克隆虽然细胞系的遗传单一,蹄选基因的稳定性和可重复性高,但由于细胞体外长期传代,其遗传基因已发生改变,不能客观反应体内的生物学特征。为此,基于乳腺癌病例组织标本,比较
2015-06-11 20:34:22
9858
1
原创 使用Bioconductor下载GEO(Gene Expression Omnibus)上的数据
library(GEOquery)gset Found 1 file(s)GSE46106_series_matrix.txt.gztrying URL 'ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE46nnn/GSE46106/matrix/GSE46106_series_matrix.txt.gz'ftp data connec
2015-05-09 20:01:41
6862
原创 Affymetrix芯片分析:获取差异表达基因系列一
实验思路:程序代码及运行结果:library(affy)%把affy包载入R中library(tcltk)%把tcltk包载入R中filters matrix(c("CEL file", ".[Cc][Ee][Ll]", "All", ".*"), ncol = 2,byrow = T)%生成2*2字符矩阵,用来定义选择文件类型
2015-04-13 22:36:51
8276
原创 Affymetrix芯片分析:获取差异表达基因系列三_SAM
source("http://bioconductor.org/biocLite.R")biocLite("ArrayExpress")library(ArrayExpress)AEsetGEO中哮喘相关的基因表达谱数据(编号GSE470) save(AEset,file="AEset.RData")load("AEset.RData")clas
2015-04-13 11:09:58
2572
原创 Affymetrix芯片分析:获取差异表达基因系列二_Moderated t statistic
library(limma)%把limma包载入R中library(tcltk)%把tcltk包载入R中library(affy)%把affy包载入R包中filters cel.files data.raw design colnames(design) eset.rma eset
2015-04-13 11:05:17
2581
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人