11、概率分布、协方差与相关性分析

概率分布、协方差与相关性分析

1. 概述

在统计学与数据分析领域,概率分布、协方差和相关性是至关重要的概念。概率分布描述了随机变量取值的可能性,协方差和相关性则用于衡量两个变量之间的关系。下面将详细介绍这些概念及其在R语言中的应用。

2. 概率分布

2.1 离散均匀分布

离散均匀分布是一种简单的概率分布,其中每个可能的结果具有相等的概率。例如,在欧洲轮盘中,37个数字(0到36)每个出现的概率都是1/37(约0.02702),这是一个伯努利试验。另一个例子是掷骰子,每个数字出现的概率是1/6(约0.16667)。

可以使用以下R代码模拟掷骰子1000000次并绘制直方图:

rolls = sample(6, size = 1000000, replace = TRUE)
hist(rolls)

2.2 正态分布

正态分布通常应用于诸如身高、体重等属性。在正态分布中,接近算术平均值的值比远离平均值的值更有可能出现。大约68%的观测值应落在均值加减一个标准差的范围内,95%的观测值应落在均值加减两个标准差的范围内。

以下代码绘制标准正态分布(均值为0,标准差为1)的概率密度函数:

curve(dnorm(x, 0 ,1), lwd = 2, xlim=c(-3,3), xlab="", ylab="",
   main = "The standard normal distribution")
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值