假设检验(z-test)

题目:

We’re trying to test whether a new,low-fat diet actually helps obese people lose weight.100 randomly assigned obese people are assigned to group 1 and put on the low fat diet.Another 100 randomly assigned obese people are assigned to group 2 and put on a diet of approximately the same amount of food,but not as low in fat.After 4 months,the mean weight loss was 9.31 lbs. for group 1(s=4.67) and 7.40 lbs.(s=4.04) for group 2.

low-fat: x1¯=9.31 s1=4.67
control: x2¯=7.4 s2=4.04
x1¯x2¯=1.91

对于“sampling distribution of difference of means”
期望:μx1¯x2¯
方差:σ2x1¯x2¯
又有公式

σ2x1¯x2¯=σ2x1x2n

其中,σ2x1x2 为population的variance of difference

置信区间:
以95%的confidence interval为例:
因为是two-tails combine一共占5%,因此,需要在z-table中找到值为2.5%的,此时,z=1.96
此时,置信区间的意义就有了:
我们能说:
95% chance that μx1¯x2¯ is within 1.96σ2x1¯x2¯ of 1.91.

接下来的事就是计算σ2x1¯x2¯
上面提到的计算这个未知量的公式,此处并不能用,因为并没有一个sample是关于x1x2的,因此,无法用单个sample的s2来作为population的σ2估计,再使用公式推出sampling distribution的σ2x¯

而由已知量入手,

σ2x1¯x2¯=σ2x1¯+σ2x2¯=σ2x1¯100+σ2x2¯100=s21100+s22100σx1¯x2¯=0.617

最后,可以说成:
95% confidence interval for μx1¯x2¯ 1.91 ± 1.21

假设检验:

先设定significance level=5%

null hypothesis: low-fat diet dose nothing.

H0:μ1μ2=0=>μx1¯x2¯=0
H1:μ1μ2>0=>μx1¯x2¯>0

首先,根据z-table找出5%的z值,为1.65

z=σx1¯x2¯

zσx1¯x2¯+0=1.01805<μx1¯x2¯=1.91

因此拒绝假设

(其实分母原始写法为:

s2n

)
### 如何在R语言中执行两个样本的Z检验 在统计学中,当已知总体的标准差时,可以使用两样本Z检验来判断两个独立样本的比例是否存在显著差异。以下是基于提供的参考资料以及专业知识,在R语言中实现两样本Z检验的方法。 #### 数据准备 假设有两个城市的智商数据,分别表示为 `sample1` 和 `sample2`,并假设它们均服从正态分布且标准差均为15。为了演示方便,这里随机生成一些模拟数据: ```r set.seed(123) # 设置种子以便结果可重复 n1 <- 100 # 样本1大小 n2 <- 120 # 样本2大小 mean1 <- 100 # 样本1平均值 mean2 <- 105 # 样本2平均值 sd_pop <- 15 # 已知总体标准差 # 随机生成数据 sample1 <- rnorm(n1, mean = mean1, sd = sd_pop) sample2 <- rnorm(n2, mean = mean2, sd = sd_pop) # 计算样本均值 x_bar1 <- mean(sample1) x_bar2 <- mean(sample2) ``` #### 手动计算Z统计量 由于已知总体标准差,可以直接通过公式手动计算Z统计量。其公式如下: \[ Z = \frac{(\bar{x}_1 - \bar{x}_2)}{\sqrt{\frac{{\sigma}^2}{n_1} + \frac{{\sigma}^2}{n_2}}} \] 其中: - $\bar{x}_1$ 和 $\bar{x}_2$ 是两个样本的均值, - $n_1$ 和 $n_2$ 是两个样本的数量, - ${\sigma}$ 是已知的总体标准差。 下面是具体的R代码实现: ```r z_statistic <- (x_bar1 - x_bar2) / sqrt((sd_pop^2 / n1) + (sd_pop^2 / n2)) p_value_two_tailed <- 2 * pnorm(-abs(z_statistic)) # 双尾P值 cat("Z statistic:", z_statistic, "\nP-value (two-tailed):", p_value_two_tailed, "\n") ``` 上述代码实现了两样本Z检验的核心部分,并输出了对应的Z统计量和双尾P值[^1]。 #### 使用内置函数验证 虽然R语言没有直接提供专门针对两样本Z检验的内置函数,但可以通过调整逻辑利用`t.test()`或其他自定义方式完成类似的分析。不过对于比例Z检验,可以借助`prop.test()`函数进行验证[^3]。 需要注意的是,如果数据不符合正态分布或方差齐性的前提条件,则应考虑采用非参数方法替代传统Z检验[^4]。 --- ### 结论 以上展示了如何在R语言环境下构建并运行一次完整的两样本Z检验过程。这不仅涉及理论公式的实际编码转换,还强调了对输入数据特性和适用范围的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值