02假设检验

1.假设检验

差别大不大,大小和影响差别的干扰影响。

有些可能是由于误差上的改变

assumptions 前提条件

hypothesis 假设

连续变量才能做t检验

hypothesis 这个页面

hist(rbinom(100000, 100, .5), freq = F, main = "",
xlab = 'Number of head', ylab = 'Probability density')

t 检验也称为 Student t 检验,它是一种使用假设检验来评估一个或两个总体均值的工具。t 检验可用于评估某个组是否与已知值有差异(单样本 t 检验),两个组是否彼此有差异(独立双样本 t 检验),或成对测量值中是否存在显著差异(成对或非独立样本 t 检验)。

参考文献:https://www.jmp.com/zh_cn/statistics-knowledge-portal/t-test.html

daily.intake = c(5260,5470,5640,6180,6390,6515,
6805,7515,7515,8230,8770)
mean(daily.intake)
sd(daily.intake)
quantile(daily.intake)
t.test(daily.intake, mu = 7725)

# Nonparametric
wilcox.test(daily.intake, mu = 7725)

# Two samlpes
x1 = rnorm(300, 0, 1)
x2 = sample(0:100, 300, rep = T)
t.test(x1, x2)

# Check normality
plot(x1); hist(x1); qqnorm(x1)
shapiro.test(x1)

假设的整个过程

第一步:第一步需要是正态

!外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

第二步:条件:1.随机分布 2.连续取样 3.样本正态的。

做出两个假设,取样。

判断是否正态1.p值是否小于0.05 2.画图俩分析。

样本量增加会增加其特点,样本量足够大,能够显著性会提高。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

第三步:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

!外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

!外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

第五步:做出决定。

!外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

2.分析回顾

样本量很大

检验正态的分布

(1)如何判断样本是否正态

判断的方法

shapiro.test(x) #p>0.05
qqnorm(x) #straight line

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

shapiro.test(rnorm(5000, mean = 5, sd = 100))
shapiro.test(runif(30, min = 2, max = 4))

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

shapiro检验可能在任何大的样本中都显示是正态分布的,因而需要引入QQ图

y <- rnorm(200, sd = 10)
qqnorm(y)
qqline(y, col = 2)

极限中值定律,它的均值是符合正态分布的,这个是可以进行证明的。

# The central limit theorem
# Exponential distribution is a skewed distribution
y <- rexp(100); hist(y, col = 'grey')
# Define a vector with length 200

sample.mean <- numeric(200)
# The mean of 200 samples
for(i in 1:200) sample.mean[i] <- mean(rexp(100))

# A normal distribution appears
hist(sample.mean , col = 'grey')
shapiro.test(sample.mean)
(1)原假设的理解

和样本量无关,是根据图片来看,中间的分布比较多,两边比较少,认为就认为它是正态分布。

原假设必须等于,等于某个值就有个分布,不能大于。大于则分析其原因。分析统计量,最后来计算。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

备择假设

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

计算统计量

!外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

pnorm(z)
t.test(x, mu=0, var.equal = T)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

t检验

t.test(x, mu=0, var.equal = F)

自由度相当于样本量。自由度越大。样本量大于30认为是可以正态分布。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

t分布与正态分布相似,t分布扁一点。(样本量少的时候,我们用t分布。)

# Plot a normal distribution and t distributions
x <- seq(-4, 4, len = 1000)
z <- dnorm(x, 0, 1)
plot(x, z, type = 'l', col = 'blue') # the normal curve
segments( 1.96, -0.05, 1.96, 0.1, col = 'brown')
segments(-1.96, -0.05,-1.96, 0.1, col = 'brown')
abline(0,0)
lines(x, dt(x, 15), col = 'green')
lines(x, dt(x, 4), col = 'red')

3.陈述假设检验

p值的情况

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

如何陈述

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

决策和结论

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

4.假设检验的“双尾”

T检验,分成了两边和左右两个方向

t.test(x, mu = 100, alt = "two.sided")

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

t.test(x, mu = 100, alt = "two.sided")

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

t.test(x, mu=100, alt = "greater")
t.test(x, mu=0, alt = "less")

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

p小于0.05就是可以推翻假设,用单尾可以更好地推翻结论。

前面是概率,后面是自由度。

qt(0.01, 22) # -2.508
prop.test(x, n, p, alternative = c("two.sided", "less", "greater"),conf.level = 0.95, correct = TRUE)
prop.test(0.77*300, 300, p=0.8)

5.配对检验

信息量多用z检验,t检验用于信息量比较。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

配对检验,更容易有小p值,信息量表征越多,越可能拒绝原假设。

在这里插入图片描述

(1)不同情况下计算“双尾”

当方差相等的情况下

t.test(x, y, var.equal = TRUE)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

方差不等的情况

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

t.test(x, y, var.equal = FALSE) # Welch’s t-test
(2)比例关系的检验

比例关系的方差

prop.test(12, 24, p=0.5) # it is a chi square test

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

两个不同的情况下,比例关系检验

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

比例关系用的是卡方检验。

x = sample(c('A','B'), 50, rep = T)
y = sample(c('F','M'), 50, rep = T)
table(x,y)

prop.test(table(x,y), correct = TRUE)

# 比例不显著
prop.test(table(x,y), correct = TRUE)
pbinom(8-1, 20, .25, lower.tail = F) = 0.1018

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

正式假设检验的步骤

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

最后的公式,()是单双尾,v是自由度

t.test(B, C, var.equal = TRUE)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

方差的计算,自由度可以

t.test(present, newer, alt=“less”, var.equal = T)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

t分布和f分布的关系。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

6.作业

7.作业

lines <-
"ID x y
1 208 197
2 202 150
3 203 255
4 200 134
5 205 266
6 206 200
7 207 189
8 208 186
9 203 215
10 210 199"
weight <- read.table(con <- textConnection(lines), header=TRUE)
close(con)
# check data
weight
head(weight)

# t test
t.test(weight$x, weight$y, var.equal = F) # two samples
t.test(weight$x, mu = 200) # one sample
shapiro.test(weight$x) # check normal distribution
shapiro.test(weight$y)
hist(weight$y)


因为上面说到了T检验,因而进行回顾一下。

什么是 t 检验?

t 检验也称为 Student t 检验,它是一种使用假设检验来评估一个或两个总体均值的工具。t 检验可用于评估某个组是否与已知值有差异(单样本 t 检验),两个组是否彼此有差异(独立双样本 t 检验),或成对测量值中是否存在显著差异(成对或非独立样本 t 检验)。

如何使用 t 检验?

首先,定义您将要检验的假设,并指定一个可接受的、得出错误结论的风险。例如,比较两个总体时,您可能会假设它们的均值相同,并且您要确定一个可接受的得出错误结论(即不存在差异时认为存在差异)的概率。接下来,您要基于数据计算检验统计量,并将其与来自 t 分布的理论值进行比较。根据结果而定,您要么拒绝原假设,要么无法拒绝原假设。

如果有两个以上的组,该怎么办?

t 检验不适合。请使用多重比较方法。例如:方差分析 (ANOVA)、Tukey-Kramer 配对比较、与单个对照进行比较的 Dunnett’s 检验以及均值分析 (ANOM)。

# Load necessary library
library(ggplot2)

# Define the gravitational constant
G <- 6.67430e-11 # in m^3 kg^-1 s^-2

# Function to calculate gravitational force
gravity_force <- function(m1, m2, r) {
  return(G * (m1 * m2) / r^2)
}

# Define masses and range of distances
m1 <- 5.97e24  # Mass of the Earth in kg
m2 <- 7.35e22  # Mass of the Moon in kg
distance <- seq(1e6, 4e8, by=1e7)  # Distance in meters from 1 million to 400 million meters

# Calculate gravitational forces
force <- gravity_force(m1, m2, distance)

# Create a data frame for plotting
data <- data.frame(distance = distance, force = force)

# Plot the gravitational force vs distance
ggplot(data, aes(x = distance, y = force)) +
  geom_line(color = "blue") +
  labs(title = "Gravitational Force vs Distance",
       x = "Distance (m)",
       y = "Gravitational Force (N)") +
  theme_minimal()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Q一件事

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值