- 博客(22)
- 收藏
- 关注
原创 R 绘图时插入图片
插入图片如何将数据的统计结果以图片的形式插入到绘制的图片中?先使用annotation_custom 方法,后续再添加其它方法的说明;f=read.table("C:\\Users\\XXX\\Desktop\\all.rRNA.txt",head=T)library(png)library(grid)library(ggplot2)summary(f) ## 保存图片mg <- readPNG("C:\\Users\\XXX\\Desktop\\a.png")g <- ras
2020-07-27 17:24:06
1891
原创 生信工程师必备技能
1.生物学背景知识生物信息就是利用统计知识和处理软件对生物标记数据进行分析,研究其具体的意义肯定要了解生物学背景的。2.生信分析类软件使用大多数人都是使用别人开发好的生信软件处理数据,软件怎么使用就是最基础的能力了;另外就是生物信息分析的软件开发,这个要求对于大多数人来说就很困难了。3.统计学基础知识在分析具体数据的时候,我们需要选择合适的分析方法对数据进行统计分析,概率论和数理统计知识是必不可少的。4.linux操作常用的命令比如ls,mkdir等等一天就可以掌握,高级一点的命令比如awk,
2020-07-23 16:15:24
1268
原创 Linux docker container 安装
1.docker容器安装有root权限,发现安装出现报错 磁盘已满,查看原因sudo df -h /var/lib/docker/dev/mapper/centos-root 6.7G 6.7G 56M 100% /网上搜了一下,发现是container 默认安装到Docker Root Dir: /var/lib/docker , 按照网上说明的修改docker root路径还是无法成功安装,索性直接将这个路径链接到其它盘阵sudo mv /var/lib/docker /var/lib
2020-07-16 17:28:19
588
原创 R 散点图,添加标签
R 散点图绘制数据情况``a=read.table(“C:\Users\XXX\Desktop\input.txt”,head=T)all=cor.test(alog2FoldChange.US.10059104.D.US.10059068.D.,alog2FoldChange.US.10059104.D.US.10059068.D.,alog2FoldChange.US.10059104.D.US.10059068.D.,alog2FoldChange.US.10059104.H.US.1005
2020-06-23 15:00:05
2754
原创 metascape
metascape 功能注释工具1.网址https://metascape.org/gp/index.html#/main/step1metascape是一个在线的功能注释网址,使用简单,说明详细,一般转录组测序分析中,挑选出的差异基因可以使用这个网址进行功能注释。2.输入推荐使用文档或EXCEL文件,内容包含基因的信息,可以是gene ID 或者 symbol。3.选择物种选择本次研究的基因对应的物种。4.执行在默认的设置下可以点击Express Analysis一键执行,个性化设置
2020-06-17 17:38:51
4975
3
原创 VEP 注释
VEP 注释Ensembl Variant Effect Predictor (VEP)VEP determines the effect of your variants (SNPs, insertions, deletions, CNVs or structural variants) on genes, transcripts, and protein sequence, as well as regulatory regions.1.下载安装http://asia.ensembl.org/i
2020-05-27 14:29:14
4492
原创 R 柱状图
R 柱状图绘制添加数据标签: geom_text()颜色模板: scale_fill_brewer(palette=“Pastel1”)输入:> library(ggplot2)> a=read.table("C:\\Users\\XXX\\Desktop\\GeneExpressionSummary.xls",head=T)> ggplot(a, aes(x=Sample, y=GeneNumber, fill=Batch)) + geom_bar(stat="ident
2020-05-25 11:38:28
471
原创 R ggplot2 添加曲线
R 添加均值曲线数据情况计算均值a.mean=aggregate(Value ~ Group, data = a, FUN = “mean”)绘图a=read.table("C:\\Users\\XXX\\Desktop\\result.finnal.xls.plot",head=T)p<-ggplot(a, aes(x=Group, y=Value)) +geom_point(size=2,shape=21,color="gray40")+theme_classic()+ scale_
2020-05-22 11:32:46
3282
原创 SRA数据下载
SRA 数据下载1.链接https://www.ncbi.nlm.nih.gov/sra/2.输入文章中accession no. SRA编号,选择每一页100 个list,然后点击 Send results to Run selector3.选择所需要下载的样品对应的SRR编号4.点击 data access,可以通过aws 或 wget直接下载wget https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos1/sra-pub-run-5/SRR
2020-05-21 11:29:48
837
原创 TCGA 数据下载
TCGATCGA 数据库是目前最大的癌症基因信息数据库,TCGA的全面不仅仅体现在众多癌型上,还体现在多组学数据,包括基因表达数据、miRNA表达数据、拷贝数变异、DNA甲基化、SNP。数据下载肿瘤研究经常需要下载相关数据,目前可以通过官网(http://www.cbioportal.org/)直接下载,或者xenabrowser 下载。xena下载比较简单,选择需要研究的癌症种类,直接下载所需的文件就可以了。https://xenabrowser.net/datapages/?hub=https
2020-05-20 17:06:29
1636
1
原创 R boxplot
R boxplot 绘图数据: a=read.table("C:\\Users\\XXX\\Desktop\\a.txt",head=T)ggplot(a, aes(x=factor(Slides), y=Yield, fill=factor(Slides))) + geom_boxplot() +theme_bw() + xlab("Slides Number")+ylab("Yield(ng)") + ggtitle("DNA yield")+scale_y_continuous(limits
2020-05-20 10:51:38
286
原创 R barplot error bar
R barplot 误差线绘图参考:http://www.cookbook-r.com/Graphs/Plotting_means_and_error_bars_(ggplot2)/数据情况tg=read.table("C:\\Users\\XXX\\Desktop\\quality.txt",head=T)library(Rmisc) library(ggplot2)# Error bars represent standard error of the meantgc <- su
2020-05-15 17:44:13
978
原创 R 绘图练习-折线图
R 折线图绘制数据筛选函数 subset绘图包 ggplot2a=read.table("C:\\Users\\XXX\\Desktop\\data.xls",head=T)b=subset(a,batch=="Batch4" |batch=="Batch5"|batch=="Batch6") ggplot(c, aes(x=datasize, y=GeneNumber,color=SampleID)) + geom_line() + geom_point()+theme_bw()+ scale_
2020-05-14 16:51:00
249
原创 大数定理
大数定理当抽样样本足够大,抽样分布趋近总体分布,均值接近总体期望。中心极限定理期望和方差一定的情况下,无论抽样分布如何,抽样的均值服从正态分布
2020-05-12 16:52:17
183
原创 非参数检验
非参数检验1. 秩和检验目的:检验两组或多组数据均值是否相等,与t检验不同的是不要求正态分布,只要求样本独立。方法:把所有数据放到一起,从小到大排列,每个数据的位置标号就是秩。两总体秩和检验;多总体秩和检验(要求,每个总体的样本含量大于5,总样本含量大于15);H0:各总体均值无明显差异;注意事项:一般来说,成组数据的t检验和方差分析比秩和检验更准确,这是由于秩和检验只利用了排序的位置信息,没有利用差值的大小,但是秩和检验可以用于更广泛,比如总体非正态、定性数据等。2. 符号检验方法:相当于
2020-05-11 17:50:40
3753
原创 生存分析
R安装install.packages(“surviaval”)install.packages(“survival”)library(KMsurv)library(survival)测试library(“survival”)library(“survminer”)data(“lung”)fit <- survfit(Surv(time, status) ~ sex, data = lung)surv_diff <- survdiff(Surv(time, status)
2020-05-11 17:47:39
361
原创 数字特征
描述性统计变量-数字特征描述性统计是借助图表或者总结性的数值来描述数据的统计手段。中心位置:描述数据的平均情况均值 mean中位数 median众位数 mode # 出现次数最多的发散程度,数据以中心位置为标准有多发散极差,PTP,max-min方差,variance,var(data),标准差,std(data)变异系数CV,cv=std(data)/mean(data)偏差程度z-score,定义z-分数(Z-Score)为测量值距均值相差的标准差数目,(data[0]
2020-05-11 17:33:27
523
原创 python 饼图绘制
python pieimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata=pd.read_csv( 'C:\\Users\\zhuxiaolong2\\Desktop\\pfizer0506\\fastQC.Batch14.45_6MAY2020.xls', engine='python', sep='\t' )data.rename( columns={"rR
2020-05-11 16:19:48
384
原创 排序
冒泡排序def bubble_sort(items): for i in range(len(items)-1): flag=False for j in range(len(items)-1-i): if(items[j]<items[j+1]): temp=items[j+1] items[j+1]=items[j] items[j]=t
2020-05-11 11:44:12
149
原创 python 简单绘图1
matplotlib 绘图例子import numpy as npimport matplotlib.pyplot as pltimport turtle as t plt.figure(figsize=(7, 6.5)) plt.plot([1,2,3,4])plt.ylabel('some numbers')plt.show()plt.savefig('C:\\Users\\XXX\\Desktop\\test2png.jpg', dpi=500)
2020-05-09 15:04:13
203
原创 python 文件读取
Python 学习之输入输出常用Excel,txt文件读取// A code blockimport pandasdata1=pandas.read_table( 'C:\\Users\\Desktop\\1.txt', engine='python', sep=',', encoding='utf-8' )data1data2=pandas.read_csv( 'C:\\Users\\Desktop\\pfizer0506\\fastQC.Ba
2020-05-09 14:20:07
122
原创 Conda 安装
1.Python3安装https://www.python.org/downloads/release/python-382/wget https://www.python.org/ftp/python/3.8.2/Python-3.8.2.tgz./configure --prefix=/usr/Python-3.8.2/Make && make installexport PATH="$PATH:/usr/Python-3.8.2"#PYTHONPATH是Pyth
2020-05-09 11:26:43
235
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人