例1.
数据大概是这个样子:

1)用 readr 包中的函数读取 mouse genes 文件
2)选取常染色体的基因
3)画以下两个基因长度 boxplot :
按染色体序号排列,从 1 开始
按基因长度中值排列,从短 -> 长 …
遇到的问题:
tibble和data frame的区别?
tibble不会自动针对每列生成因子
分别读入tibble和data frame数据?
mouse.tibble <- read_delim( file = "mouse_genes_biomart_sep2018.txt", delim = "\t", quote = "" )
mouse_gene<-read_tsv("data/talk04/mouse_genes_biomart_sep2018.txt")
如何按照条件筛选指定的行?
1. 用which读取指定行(tibble和data frame都可以,这里以data frame为例)
mouse_gene_MT<-mouse_gene[which(mouse_gene$`Chromosome/scaffold name` == “MT”),] #选取线粒体上的染色体
mouse_gene_MT<-mouse_gene[which(mouse_gene$`Chromosome/sc

这篇博客记录了R语言中tibble与data frame的区别及操作,包括读取数据、筛选行、自定义图表x轴顺序。通过dplyr包进行数据处理,使用which、filter和subset函数筛选数据,并讨论了如何解决factor在图表排序中的问题。同时,介绍了长数据和宽数据的转换以及结果保存和饼图绘制。
最低0.47元/天 解锁文章
2630





