ChiMerge算法:卡方检验+ChiMerge+Python

本文详细介绍了卡方分布的定义、概率密度函数、性质及自由度,阐述了卡方检验的基本原理、计算方法和应用场景,如拟合优度检验和独立性检验。同时,讲解了Python中实现卡方检验的步骤,并提及ChiMerge算法,一种基于卡方检验的数据离散化方法。

卡方分布与卡方检验

卡方分布

  • 定义
    • 若n个相互独立的随机变量 ξ 1 , ξ 2 , … , ξ n \xi_{1},\xi_{2},\dots,\xi_{n} ξ1,ξ2,,ξn均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和 Q = ∑ i = 1 n ξ i 2 Q=\sum_{i=1}^{n}\xi_{i}^{2} Q=i=1nξi2 构成一个新的随机变量,其分布规律称为 χ 2 \chi_{2} χ2分布(chi-square distribution),记为 Q Q Q满足自由度为 v v v χ 2 \chi_{2} χ2分布 Q ∼ χ 2 ( v ) Q \sim \chi^{2}(v) Qχ2(v) Q ∼ χ v 2 Q \sim \chi^{2}_{v} Qχv2(其中 v = n − k v=n-k v=nk k k k为限制条件数);
    • 卡方分布是由正态分布构造而成的一个新的分布,当自由度 v v v很大时,卡方分布近似为正态分布。
  • 概率密度函数
    • 概率密度函数
    • f ( x ; k ) = { x ( k / 2 ) − 1 e − x / 2 2 k / 2 Γ ( k 2 ) , x ≥ 0 0 ,  otherwise  f(x ; k)=\left\{\begin{array}{ll} \frac{x^{(k / 2)-1} e^{-x / 2}}{2^{k / 2} \Gamma\left(\frac{k}{2}\right)}, & x \geq 0 \\ 0, & \text { otherwise } \end{array}\right. f(x;k)={ 2k/2Γ(2k)x(k/2)1ex/2,0,x0 otherwise 
    • 其中, Γ ( k 2 ) \Gamma (\frac {k}{2})
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值