R与χ²分布（1）概率密度函数

最新推荐文章于 2025-09-04 13:33:18 发布

原创最新推荐文章于 2025-09-04 13:33:18 发布 · 3.5k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#r语言

R 同时被 2 个专栏收录

22 篇文章

订阅专栏

Data analysis

20 篇文章

订阅专栏

本文介绍了卡方分布的基本概念及其在统计学中的应用。卡方分布是通过将k个独立的标准正态分布变量的平方和得到的，其自由度为k。文章还探讨了卡方分布在假设检验和置信区间计算中的作用，并列举了几种常见的卡方检验应用场景。

卡方分布（chi-square distribution, χ²-distribution）是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布。假设检验和置信区间的计算。

由卡方分布延伸出来皮尔森卡方检定常用于：
(1)样本某性质的比例分布与总体理论分布的拟合优度；
(2)同一总体的两个随机变量是否独立；
(3)二或多个总体同一属性的同素性检定。

数学定义
若k个随机变量Z_1、……、Z_k是相互独立，符合标准正态分布的随机变量（数学期望为0、方差为1），则随机变量Z的平方和
[img]http://upload.wikimedia.org/math/1/8/1/181776d8fe5a35865529c7a7a7157f9d.png[/img]
被称为服从自由度为 k 的卡方分布，记作
[img]http://upload.wikimedia.org/math/d/f/e/dfec0484bdccc45a71e8393cb6e02c3f.png[/img]
卡方分布的概率密度函数为：
[img]http://upload.wikimedia.org/math/7/c/6/7c6754d1c597c0bfdc98d52ab3e2ff72.png[/img]
其中x≥0，当x≤0时f_k(x)=0。这里Γ代表Gamma函数


set.seed(1000)
x<-seq(0,10,length.out=1000)
y<-dchisq(x,1)

plot(x,y,col="red",xlim=c(0,5),ylim=c(0,2),type='l',
     xaxs="i", yaxs="i",ylab='density',xlab='',
     main="The Chisq Density Distribution")

lines(x,dchisq(x,2),col="green")
lines(x,dchisq(x,3),col="blue")
lines(x,dchisq(x,10),col="orange")

legend("topright",legend=paste("df=",c(1,2,3,10)), lwd=1, col=c("red", "green","blue","orange"))

结果如下：

[img]http://dl2.iteye.com/upload/attachment/0103/6041/bd765f2f-00a9-372b-97b3-91b3761e364f.png[/img]