多指标面板数据因子分析
1 多指标面板数据的统计特征
严格来说,多指标面板数据是不能用二维数据表示 的,应该用三维数据,但是可以把三维数据在平面上转换成二维的形式。 设总体有 N N N个样本,每个样本有 p p p个指标变量,时间跨度为 T T T,则 X i j ( t ) X_{ij}(t) Xij(t)表示第 i i i个样本的第 j j j个变量在时间 t t t的取值。
在因子分析的过程中,多指标面板数据的统计函数也与截面数据的统计函数截然不同,设多指标面板数据为 X i j ( t ) X_{ij}(t) Xij(t), i = 1 , . . . , N , j = 1 , . . . , p , t = 1 , . . . , T i = 1,...,N, j = 1,...,p, t=1,...,T i=1,...,N,j=1,...,p,t=1,...,T,则有第 j j j个指标的均值为:
X ˉ j = 1 N 1 T ∑ t = 1 T ∑ i = 1 N X i j ( t ) \bar{X}_{j}=\frac{1}{N} \frac{1}{T} \sum_{t=1}^{T} \sum_{i=1}^{N} X_{i j}(t) Xˉj=N1T1t=1∑Ti=1∑NXij(t)
第 j j j个指标的方差为:
V A R X j = 1 T 1 N − 1 ∑ i = 1 N [ X j ( t ) − X ‾ j ] 2 \mathrm{VAR}_{\mathrm{X}_{j}}=\frac{1}{\mathrm{~T}} \frac{1}{\mathrm{~N}-1} \sum_{i=1}^{\mathrm{N}}\left[\mathrm{X}_{\mathrm{j}}(\mathrm{t})-\overline{\mathrm{X}}_{j}\right]^{2} VARXj= T1 N−11i=1∑N[Xj(t)−Xj]2
对于不同时点 0 ⩽ t 1 < t 2 ⩽ T 0 \leqslant \mathrm{t}_1<\mathrm{t}_{2} \leqslant \mathrm{T} 0⩽t1<t2⩽T,第 j j j个指标的协方差函数为:
COV x j ( t 1 , t 2 ) = 1 N − 1 ∑ i = 1 N [ X i j ( t 1 ) − X ‾ j ] [ X i j ( t 2 ) − X ‾ j ] \operatorname{COV}_{\mathrm{x}_{\mathrm{j}}}\left(\mathrm{t}_1, \mathrm{t}_2\right)=\frac{1}{\mathrm{N}-1} \sum_{\mathrm{i}=1}^{\mathrm{N}}\left[\mathrm{X}_{\mathrm{ij}}\left(\mathrm{t}_{1}\right)-\overline{\mathrm{X}}_{j} \right]\left[\mathrm{X}_{\mathrm{ij}}\left(\mathrm{t}_{2} \right)-\overline{\mathrm{X}}_{j}\right] COVxj

最低0.47元/天 解锁文章
3079

被折叠的 条评论
为什么被折叠?



