线性回归模型
普通最小二乘法(OLS)
- 概念:通过最小化预测值与实际值之间的平方误差来拟合线性模型。
- 数学表达式:
β ^ = ( X T X ) − 1 X T y \hat{\beta} = (X^TX)^{-1}X^Ty β^=(XTX)−1XTy
广义最小二乘法(GLS)
- 概念:适用于数据具有异方差或自相关的情况。
- 数学表达式:
β ^ G L S = ( X T Ω − 1 X ) − 1 X T Ω − 1 y \hat{\beta}_{GLS} = (X^T\Omega^{-1}X)^{-1}X^T\Omega^{-1}y β^GLS=(XTΩ−1X)−1XTΩ−1y
加权最小二乘法(WLS)
- 概念:通过为每个样本赋予不同的权重来进行回归。
- 数学表达式:
β ^ W L S = ( X T W X ) − 1 X T W y \hat{\beta}_{WLS} = (X^TWX)^{-1}X^TWy β^WLS=(XTWX)−1XTWy
带有自回归误差的最小二乘法
- 概念:考虑模型误差的自相关性。
分位数回归
- 概念:估计不同分位数上的条件分布函数。
- 数学表达式:
β ^ = arg min β ∑ i = 1 n ρ τ ( y i − x i T β ) \hat{\beta} = \arg\min_\beta \sum_{i=1}^{n} \rho_\tau (y_i - x_i^T \beta) β^=argβmini=1∑nρτ(yi−xiTβ)
其中, ρ τ \rho_\tau ρτ 是检查函数。
递归最小二乘法(RLS)
- 概念:在线性模型中,随着新数据的到来,不断更新参数估计。
混合线性模型(含混合效应和方差分量)
- 概念:考虑固定效应和随机效应的模型。
- 数学表达式:
y = X β + Z γ + ϵ y = X\beta + Z\gamma + \epsilon y=Xβ+Zγ+ϵ
其中, γ ∼ N ( 0 , G ) \gamma \sim N(0, G) γ∼N(0,G) 和 ϵ ∼ N ( 0 , R ) \epsilon \sim N(0, R) ϵ∼N(0,R)。
广义线性模型(GLM)
- 概念:支持一参数指数族分布的模型。
- 数学表达式:
g ( E [ Y ] ) = X β g(\mathbb{E}[Y]) = X\beta g(E[Y])=Xβ
其中, g g g 是连接函数。
贝叶斯混合广义线性模型
- 概念:适用于二项分布和泊松分布的贝叶斯模型。
广义估计方程(GEE)
- 概念:用于单向聚类或纵向数据的回归模型。
离散模型
Logit 和 Probit 模型
- 概念:用于二分类问题。
- 数学表达式(Logit):
P ( Y = 1 ∣ X ) = 1 1 + e − X β P(Y=1|X) = \frac{1}{1+e^{-X\beta}} P(Y=1∣X)=1+e−Xβ1
多项Logit模型(MNLogit)
- 概念:用于多分类问题。
泊松和广义泊松回归
- 概念:用于建模计数数据。
- 数学表达式:
P ( Y = k ) = λ k e − λ k ! P(Y=k) = \frac{\lambda^k e^{-\lambda}}{k!} P(Y=k)=k!λke−λ
负二项回归
- 概念:处理过度离散的计数数据。
零膨胀计数模型
- 概念:处理数据集中有大量零值的情况。
牢靠线性模型(RLM)
- 概念:支持多种M估计量的稳健回归模型。
时间序列分析
状态空间建模框架
- 概念:处理各种时间序列模型的通用框架。
季节性ARIMA和ARIMAX模型
- 概念:扩展ARIMA模型以考虑季节性和外部回归变量。
VARMA和VARMAX模型
- 概念:多变量时间序列的自回归和移动平均模型。
动态因子模型
- 概念:用于多变量时间序列分析的因子模型。
未观测组件模型
- 概念:分解时间序列为不同的未观测成分。
马尔科夫切换模型(MSAR)
- 概念:也称为隐马尔科夫模型(HMM),用于处理具有不同状态的时间序列。
单变量时间序列分析
- 概念:包括AR、ARIMA模型。
向量自回归模型(VAR)和结构VAR
- 概念:用于多变量时间序列建模。
向量误差修正模型(VECM)
- 概念:考虑共整合关系的VAR模型。
指数平滑法
- 概念:如霍尔特-温特斯方法,用于时间序列的平滑和预测。
时间序列假设检验
- 概念:包括单位根检验、协整检验等。
生存分析
比例风险回归(Cox模型)
- 概念:建模生存数据中的比例风险。
生存函数估计(Kaplan-Meier)
- 概念:非参数生存分析方法。
累积发病函数估计
- 概念:估计竞争风险下的发病率。
多变量分析
主成分分析(PCA)
- 概念:用于降维和缺失数据的分析。
因子分析
- 概念:用于数据降维和解释变量关系。
多变量方差分析(MANOVA)
- 概念:分析多个因变量的方差。
典型相关分析
- 概念:分析两组变量之间的相关性。
非参数统计
核密度估计
- 概念:用于估计概率密度函数。
数据集和统计测试
数据集
- 概念:用于示例和测试的数据集。
统计测试
- 概念:包括各种统计检验、诊断和规范性测试。
杂项模型
泛型矩方法(GMM)估计
- 概念:用于参数估计的通用方法。
核回归
- 概念:用于非参数回归分析。
面板数据模型
- 概念:分析面板数据的方法。
信息理论度量
- 概念:用于模型选择和比较的度量方法。