R语言中的系统发育数据案例研究
在系统发育分析中,R语言是一个强大的工具。下面将通过几个案例研究,详细介绍如何使用R语言处理和分析系统发育数据。
1. 数据可视化与处理基础
利用“DNAbin”对象的高效子集功能,可以轻松放大比对的一部分。以木鼠数据为例,展示前50个核苷酸中鸟嘌呤和缺失数据的情况。以下是具体代码:
x <- woodmouse[, 1:50]
image(x, c("g", "n"), c("black", "grey"))
grid(ncol(x), nrow(x), col = "lightgrey")
此外,ape包中的 del.gaps 函数可用于移除所有插入的空位(-),并将序列作为列表返回。
2. 案例研究
2.1 Sylvia莺类数据处理
Böhning - Gaese等人研究了26种Sylvia莺类的生态位进化,并对这些物种的细胞色素b基因进行了测序,序列存于GenBank,登录号为AJ534526 - AJ534549和Z73494。我们的目标是从GenBank获取序列数据、进行比对,并从文件中读取生态数据。
- 获取序列数据
x <- paste("AJ5345", 26:49, sep = "")
x <- c("Z73494", x)
sylvia.seq <- read.GenBank(x)
</
超级会员免费看
订阅专栏 解锁全文
2291

被折叠的 条评论
为什么被折叠?



