生物信息学中的数据探索与基因组分析
1. 数据探索与统计分析
1.1 Anscombe四重奏
Anscombe四重奏是一组非常有趣的数据,其所有数据集的相关系数均为0.816,线性回归线也相同,均为y = 3.0 × 0.5x。但不能被简单的回归分析所误导,因为它们的分布形态有很大差异。
以下是绘制Anscombe四重奏的R代码:
> anscombe<-read.table(
+ "http://www.hs-mittweida.de/wuenschi/data/media/
+ compbiolbook/anscombe.tab",header=TRUE,sep="\t")
> attach(anscombe)
> par(mfrow=c(2,2))
> plot(ax1,ay1,xlim=c(4,18),ylim=c(3,12),col="blue")
> abline(lm(ay1~ax1))
> plot(ax2,ay2,xlim=c(4,18),ylim=c(3,12),col="blue")
> abline(lm(ay2~ax2))
> plot(ax3,ay3,xlim=c(4,18),ylim=c(3,12),col="blue")
> abline(lm(ay3~ax3))
> plot(ax4,ay4,xlim=c(4,18),ylim=c(3,12),col="blue")
> abline(lm(ay4~ax4))
> par(mfrow=c(1,1))
在上述代
超级会员免费看
订阅专栏 解锁全文
698

被折叠的 条评论
为什么被折叠?



