R与χ²分布(1) 概率密度函数

本文介绍了卡方分布的基本概念及其在统计学中的应用。卡方分布是通过将k个独立的标准正态分布变量的平方和得到的,其自由度为k。文章还探讨了卡方分布在假设检验和置信区间计算中的作用,并列举了几种常见的卡方检验应用场景。
卡方分布(chi-square distribution, χ²-distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布。假设检验和置信区间的计算。

由卡方分布延伸出来皮尔森卡方检定常用于:
(1)样本某性质的比例分布与总体理论分布的拟合优度;
(2)同一总体的两个随机变量是否独立;
(3)二或多个总体同一属性的同素性检定。

数学定义
若k个随机变量Z_1、……、Z_k是相互独立,符合标准正态分布的随机变量(数学期望为0、方差为1),则随机变量Z的平方和
[img]http://upload.wikimedia.org/math/1/8/1/181776d8fe5a35865529c7a7a7157f9d.png[/img]
被称为服从自由度为 k 的卡方分布,记作
[img]http://upload.wikimedia.org/math/d/f/e/dfec0484bdccc45a71e8393cb6e02c3f.png[/img]
卡方分布的概率密度函数为:
[img]http://upload.wikimedia.org/math/7/c/6/7c6754d1c597c0bfdc98d52ab3e2ff72.png[/img]
其中x≥0,当x≤0时f_k(x)=0。这里Γ代表Gamma函数

set.seed(1000)
x<-seq(0,10,length.out=1000)
y<-dchisq(x,1)

plot(x,y,col="red",xlim=c(0,5),ylim=c(0,2),type='l',
xaxs="i", yaxs="i",ylab='density',xlab='',
main="The Chisq Density Distribution")

lines(x,dchisq(x,2),col="green")
lines(x,dchisq(x,3),col="blue")
lines(x,dchisq(x,10),col="orange")

legend("topright",legend=paste("df=",c(1,2,3,10)), lwd=1, col=c("red", "green","blue","orange"))


结果如下:

[img]http://dl2.iteye.com/upload/attachment/0103/6041/bd765f2f-00a9-372b-97b3-91b3761e364f.png[/img]
### Ljung-Box 检验 χ&sup2; 分布 Ljung-Box 检验是一种用于检测时间序列数据中是否存在显著自相关的方法。其核心思想是通过构建一个统计量 \( Q_m \),该统计量近似服从自由度为 \( m-p-q \) 的卡方 (\( \chi^2 \)) 分布[^1]。具体而言: \[ Q_m = n (n + 2) \sum_{k=1}^{m} \frac{r_k^2}{n-k}, \] 其中: - \( n \) 是样本数量, - \( r_k \) 是第 \( k \) 阶滞后自相关系数, - \( m \) 是最大滞后期。 此统计量在原假设成立的情况下(即残差序列为白噪声),渐进地服从 \( \chi^2(m-p-q) \) 分布,这里 \( p \) 和 \( q \) 分别表示模型中的 AR 和 MA 参数阶数。 #### 如何查找 χ&sup2; 分布表? χ&sup2; 分布表通常可以在以下资源中找到: 1. **教科书附录**:许多统计学教材会在最后提供标准的概率分布临界值表,其中包括 χ&sup2; 分布2. **在线工具和计算器**:可以访问诸如 Wolfram Alpha 或其他专门的统计网站来查询特定自由度下对应的概率密度或累积分布函数值。 3. **编程环境内置功能**:例如 R 中可以直接使用 `pchisq()` 函数获取累计概率或者 `qchisq()` 获取分位数值;Python 则可以通过 SciPy 库实现类似操作。 以下是 Python 实现的一个例子,展示如何计算给定自由度下的 χ&sup2; 分布百分位点: ```python from scipy.stats import chi2 def get_chi_square_critical_value(df, alpha): """ 计算指定自由度 df 下 α 显著水平的 χ&sup2; 分布临界值 :param df: 自由度 :param alpha: 显著性水平 :return: 对应的临界值 """ critical_value = chi2.ppf(1-alpha, df) return critical_value # 示例调用 df_example = 5 # 假设自由度为5 alpha_level = 0.05 # 设定α=0.05 critical_val = get_chi_square_critical_value(df_example, alpha_level) print(f"自由度 {df_example} 下,α={alpha_level} 的 χ&sup2; 分布临界值为: {critical_val}") ``` 上述代码片段展示了基于 SciPy 库求解某一固定自由度条件下不同置信区间所对应的具体阈值方法[^4]。 #### 结论 综上所述,对于执行 Ljung-Box 检验时所需的 χ&sup2; 分布表格,既可以选择查阅传统纸质书籍里的标准化图表资料,也可以借助现代软件包快速完成相应数值提取工作。无论采用哪种方式,都需注意匹配实际应用场景下的参数设定情况,比如确切的有效自由度数目以及目标风险容忍率等因素影响最终判定结论准确性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值