概率分布、协方差与相关性分析
1. 概述
在统计学与数据分析领域,概率分布、协方差和相关性是至关重要的概念。概率分布描述了随机变量取值的可能性,协方差和相关性则用于衡量两个变量之间的关系。下面将详细介绍这些概念及其在R语言中的应用。
2. 概率分布
2.1 离散均匀分布
离散均匀分布是一种简单的概率分布,其中每个可能的结果具有相等的概率。例如,在欧洲轮盘中,37个数字(0到36)每个出现的概率都是1/37(约0.02702),这是一个伯努利试验。另一个例子是掷骰子,每个数字出现的概率是1/6(约0.16667)。
可以使用以下R代码模拟掷骰子1000000次并绘制直方图:
rolls = sample(6, size = 1000000, replace = TRUE)
hist(rolls)
2.2 正态分布
正态分布通常应用于诸如身高、体重等属性。在正态分布中,接近算术平均值的值比远离平均值的值更有可能出现。大约68%的观测值应落在均值加减一个标准差的范围内,95%的观测值应落在均值加减两个标准差的范围内。
以下代码绘制标准正态分布(均值为0,标准差为1)的概率密度函数:
curve(dnorm(x, 0 ,1), lwd = 2, xlim=c(-3,3), xlab="", ylab="",
main = "The standard normal distribution")
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



