核密度估计是用于估计随机变
量概率密度函数的一种非参数方法。虽然其数学细节已经超出了本书的范畴,但从总体上讲,核
密度图不失为一种用来观察连续型变量分布的有效方法。绘制密度图的方法(不叠加到另一幅图
上方)为:
plot(density(x))
其中的x是一个数值型向量。由于plot()函数会创建一幅新的图形,所以要向一幅已经存在的图
形上叠加一条密度曲线,可以使用lines()函数
par(mfrow=c(2,1))
d <- density(mtcars$mpg)
plot(d)
d <- density(mtcars$mpg)
plot(d, main="Kernel Density of Miles Per Gallon")
polygon(d, col="red", border="blue")
rug(mtcars$mpg, col="brown")

polygon()函数根据顶点的x和y坐标(本例中由density()函数提供)绘制了多边形。
核密度图可用于比较组间差异。可能是由于普遍缺乏方便好用的软件,这种方法其实完全没
有被充分利用。幸运的是,sm包漂亮地填补了这一缺口。
使用sm包中的sm.density.compare()函数可向图形叠加两组或更多的核密度图。使用格
式为:
sm.density.compare(x, factor)
其中的x是一个数值型向量,f
核密度图是R语言中用于观察连续型变量分布的有效工具。通过density()函数可以创建密度图,使用lines()或polygon()进行叠加。sm包的sm.density.compare()函数能对比不同组间的核密度差异,例如在汽车里程数据中比较不同汽缸车型的分布。在使用前需安装sm包。
订阅专栏 解锁全文
4043

被折叠的 条评论
为什么被折叠?



