统计学之线性回归及卡方分布与方差分析

这篇博客探讨了线性回归中的平方误差概念,并介绍了最小二乘法在求解模型参数中的应用。同时,文章详细阐述了卡方分布的定义、性质,包括其与标准正态分布的关系以及随着自由度变化的特性。
  • 线性回归中的平方误差

假设线性方程为y=ax+b

对于训练数据(X1,Y1),(X2,Y2),(X3,Y3),(X4,Y4)...(X_{n},Y_{n})

平方误差为:E=\sum_{i=1}^{n}(aX_{i}+b-Y_{i})^{2}

  • 线性回归公式的推导

  • 最小二乘法分析:

  • 回归分析的最初目的是估计模型的参数以便达到对数据的最佳拟合。在决定一个最佳拟合的不同标准之中,最小二乘法是非常优越的。这种估计可以表示为:

公式推导,略

 

卡方分布

 

### 分布差公式推导 分布($\chi^2$-distribution)是一种重要的概率分布,广泛应用于统计学中。其差公式为 $2n$,其中 $n$ 是自由度。以下是关于分布差公式的推导过程。 #### 1. 标准正态分布的基础性质 若随机变量 $X_i \sim N(0, 1)$,即 $X_i$ 服从标准正态分布,则有以下性质: - $E[X_i] = 0$ - $Var(X_i) = 1$ 对于标准正态分布的平 $X_i^2$,可以证明其期望和差分别为: $$ E[X_i^2] = Var(X_i) + (E[X_i])^2 = 1 + 0^2 = 1 $$ $$ Var(X_i^2) = E[(X_i^2)^2] - (E[X_i^2])^2 $$ 进一步计算 $E[(X_i^2)^2]$: $$ E[(X_i^2)^2] = E[X_i^4] $$ 根据标准正态分布的矩生成函数或直接积分计算可得: $$ E[X_i^4] = 3 $$ 因此: $$ Var(X_i^2) = E[(X_i^2)^2] - (E[X_i^2])^2 = 3 - 1^2 = 2 $$ #### 2. 分布的定义性质 设 $X_1, X_2, \dots, X_n$ 是来自总体 $N(0, 1)$ 的独立样本,则统计量 $\chi^2$ 定义为: $$ \chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2 $$ 由于 $X_i^2$ 是独立同分布的随机变量,且每个 $X_i^2$ 的期望为 1,差为 2,根据随机变量的线性组合性质: $$ E[\chi^2] = E[X_1^2 + X_2^2 + \cdots + X_n^2] = n \cdot E[X_i^2] = n \cdot 1 = n $$ $$ Var(\chi^2) = Var(X_1^2 + X_2^2 + \cdots + X_n^2) = n \cdot Var(X_i^2) = n \cdot 2 = 2n $$ #### 3. 总结 通过上述推导可知,分布差公式为 $2n$,其中 $n$ 是自由度[^2]。 ```python # 示例代码:验证分布差 import numpy as np # 自由度 n n = 10 # 生成标准正态分布的随机数 samples = np.random.normal(0, 1, size=(100000, n)) # 计算分布值 chi_squared = np.sum(samples**2, axis=1) # 计算样本均值和差 mean_chi_squared = np.mean(chi_squared) var_chi_squared = np.var(chi_squared) print(f"Mean: {mean_chi_squared}, Expected Mean: {n}") print(f"Variance: {var_chi_squared}, Expected Variance: {2 * n}") ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值