卡方分布与卡方检验
卡方分布
- 定义
- 若n个相互独立的随机变量 ξ 1 , ξ 2 , … , ξ n \xi_{1},\xi_{2},\dots,\xi_{n} ξ1,ξ2,…,ξn均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和 Q = ∑ i = 1 n ξ i 2 Q=\sum_{i=1}^{n}\xi_{i}^{2} Q=∑i=1nξi2 构成一个新的随机变量,其分布规律称为 χ 2 \chi_{2} χ2分布(chi-square distribution),记为 Q Q Q满足自由度为 v v v的 χ 2 \chi_{2} χ2分布 Q ∼ χ 2 ( v ) Q \sim \chi^{2}(v) Q∼χ2(v) Q ∼ χ v 2 Q \sim \chi^{2}_{v} Q∼χv2(其中 v = n − k v=n-k v=n−k, k k k为限制条件数);
- 卡方分布是由正态分布构造而成的一个新的分布,当自由度 v v v很大时,卡方分布近似为正态分布。
- 概率密度函数

- f ( x ; k ) = { x ( k / 2 ) − 1 e − x / 2 2 k / 2 Γ ( k 2 ) , x ≥ 0 0 , otherwise f(x ; k)=\left\{\begin{array}{ll} \frac{x^{(k / 2)-1} e^{-x / 2}}{2^{k / 2} \Gamma\left(\frac{k}{2}\right)}, & x \geq 0 \\ 0, & \text { otherwise } \end{array}\right. f(x;k)={ 2k/2Γ(2k)x(k/2)−1e−x/2,0,x≥0 otherwise
- 其中, Γ ( k 2 ) \Gamma (\frac {k}{2})

本文详细介绍了卡方分布的定义、概率密度函数、性质及自由度,阐述了卡方检验的基本原理、计算方法和应用场景,如拟合优度检验和独立性检验。同时,讲解了Python中实现卡方检验的步骤,并提及ChiMerge算法,一种基于卡方检验的数据离散化方法。
最低0.47元/天 解锁文章
2321





