Empirical Covariance 经验协方差 sklearn

本文深入探讨了sklearn库中经验协方差(Empirical Covariance)在离群点检测中的应用,重点讲解了EllipticEnvelope函数如何通过计算数据集的协方差来识别离群点,以及其背后的数学原理和技术细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sklearn中的离群点检测中,有个Empirical  Covariance,翻译过来,为,经验协方差。

对应  EllipticEnvelope 函数。 

实际上应该是sklearn.base工具包下,关于离群点检测函数的一个封装,目的在于用协方差来计算给定数据集离群点。

EllipticEnvelope类继承自,OutlierMixin和MinCovDet这两个父类。

类OutlierMixin作用是混合scikit-lear所有离群点检测估计工具的工具类。

类MinCovDet作用是计算最小协方差行列式(MCD)。

 

 

### 自回归模型中的协方差矩阵 #### 定义与背景 自回归(AR)模型是一类用于预测时间序列的方法,在该模型中,当前观测值被认为是过去若干个观测值的线性组合加上随机噪声项。对于一个p阶自回归过程 AR(p),可以表达为: \[ y_t = c + \phi_1y_{t-1}+\phi_2y_{t-2}+...+\phi_py_{t-p}+\epsilon_t, \] 其中 \(c\) 是常数项,\(\phi_i (i=1,...,p)\) 表示滞后系数,而 \(\epsilon_t\) 则代表白噪音误差。 当涉及到多维向量的时间序列时,则需要用到多元自回归(MVAR)模型来捕捉不同维度间的关系。此时就需要引入协方差矩阵的概念[^1]。 #### 多元自回归模型下的协方差矩阵构建 在一个MVAR(p)过程中,假设存在 d 维度的数据集 Y(t), t ∈ Z ,那么其一般形式可写作: \[Y(t)=A_1Y(t−1)+⋯+A_pY(t−p)+E(t).\] 这里 A_k(k=1,…,p) 为d×d大小的参数矩阵; E(t)~WN(0,Σ_e) , Σ_e即为残差项之间的协方差矩阵[^3]. 为了估计这些未知参数以及获得关于整个系统的更多信息,通常会基于样本数据计算经验协方差矩阵 S : \[S=\frac{1}{T}\sum^{T}_{t=p+1}(Y(t)-\bar{Y})(Y(t)-\bar{Y})'\], 此处 T 表示总的观察次数,\( \bar{Y} \) 为所有时刻下各分量取平均后的向量[^2]. 值得注意的是,在实际应用当中可能会采用无偏版本的经验协方差矩阵公式,即将上述公式的分母由 T 改变为 T - p 或者其他适当调整因子以减少偏差影响. 通过求解最小二乘法或其他优化算法可以获得最优拟合参数,并进一步得到相应的理论协方差结构。这有助于深入理解各个变量间的动态关联模式并支持后续建模工作。 ```python import numpy as np def compute_covariance_matrix(Y): """ Compute the empirical covariance matrix of a multivariate time series. Parameters: Y : array-like shape=(time_steps, dimensions) The input data where each column represents one dimension. Returns: cov_mat : ndarray shape=(dimensions, dimensions) Empirical covariance matrix computed from `Y`. """ mean_Y = np.mean(Y, axis=0) centered_data = Y - mean_Y # Using unbiased estimator with denominator N-1 instead of N cov_mat = np.dot(centered_data.T, centered_data)/(len(Y)-1) return cov_mat ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值