结构化多因子模型

结构化风险因子模型利用一组共同因子和一个仅与该股票有关的特质因子解释股票的收益率,并利用共同因子和特质因子的波动来解释股票收益率的波动。结构化多因子风险模型的优势在于,通过识别重要的因子,可以降低问题的规模,只要因子个数不变,即使股票组合的数量发生变化,处理问题的复杂度也不会发生变化。

结构化多因子风险模型首先对收益率进行简单的线性分解,分解方程中包含四个组成部分:股票收益率、因子暴露、因子收益率和特质因子收益率。那么,第j只股票的线性分解如下所示:

也可以写成矩阵表达式:

其中,Rj表示第j只股票的收益率;Xj表示第j只股票在第k个因子上的暴露(也称为因子载荷,本质上说白了就是该股票的所对应的因子值);Fj表示第j只股票第k个因子的因子收益率(即每单位因子暴露所承载的收益率);u表示第j只股票的特质因子收益率。(一般情况下,我们都用N代表股票数,K代表因子数)

我们定义因子暴露(因子值)是在时刻t的结果,那么股票收益率、因子收益率和特质因子收益率均为t+1的结果。这就是一个很典型的,用因子当期值,来预测下一期因子收益率的问题了。

令投资组合的权重

那么投资组合的收益率为

 

现在我们假设每只股票的特质因子收益率与共同因子收益率不相关,并且每只股票的特质因子收益率也不相关(此假设后续模型一直能用到,非常关键)。那么在上述表达式的基础上,可以得到组合的风险结构为:

其中,X表示N只个股在K个风险因子上的因子载荷矩阵(N*K),F表示因子收益率的协方差矩阵(K*K),

delta表示因子的特异收益率方差矩阵(N*N的对角阵)。

一、多因子模型的预处理流程

1 去极值

目前去极值一般有三种方法:均值方差去极值、MAD方法去极值、分位数去极值、

(1)均值方差去极值

求每一个因子的均值和方差,大于  和小于  的样本值转化为  和  。

(2)MAD法去极值

MAD 法是针对均值标准差方法的改进,把均值和标准差替换成稳健统计量,样本均值用样本中位数代替,样本标准差用样本MAD代替:

通常把偏离中位数三倍MADe(如果样本满足正态分布,且数据量较大,可以证明  )以上的数据作为异常值。和均值标准差方法比,中位数和MAD的计算不受极端异常值的影响,结果更加稳健。

(3)分位数去极值

分位数去极值是一种经验处理方法,假设Q1和Q3分别为数据从小到大排列的25%和 75%分位数,记IQR=Q3-Q1, 把区间 

里的数据标识为异常点。

分位数是稳健统计量,因此分位数方法对极值不敏感,但如果样本数据正偏严重,且右尾分布明显偏厚时,分位数去极值方法会把过多的数据划分为异常数据。

所以,有了改进的分位数去极值法:

然后定义了调整的上下限:

在区间上的数据被定义成了异常值。

2 标准化

每个因子做完了去极值之后,就要消除各个因子之间的量纲影响,进行标准化。标准化的步骤通常都是zscore标准化法,非常基础,没什么可说的。

3 中性化

中性化的内容barra框架中并未提及,但是在A股市场中,各家研报都认为中性化仍然很有必要的。

首先:A股票行业轮动明显,行业热点之间切换迅速,量化模型也很难有效预测轮动规律;其次,A股的小市值个股占比显著高于国外市场小市值个股具有高波动率、高收益率的特性,为了降低投资组合的波动性和回撤,需要进行行业中性化和市值中性化处理。

个人认为,如果说要博取更大的投资收益,并承担更高风险的话。市值中性化是可以不用去做的,因为A股市场最近十几年以来,小市值因子至少有20倍以上的收益。并且到2016年,小市值因子的有效性也没有消失。2017年初,小市值因子确实出现了失效的情况,但是未来会不会有效,这个就是玄学了。

不做市值中性化的话,完全可以建立一个市值轮动模型进行替代。行业中性化也是同理。但是如果想找到稳定的alpha因子,那么市值中性化和行业中性化还是要做的。

行业中性化通常有两种办法:

1.简单的标准化法

利用申万行业指数,将各个行业内股票的因子进行标准化处理,即减均值除标准差。

2.回归取残差法

将因子值作为y,行业哑变量作为x,进行线性回归,然后回归模型的残差即为行业中性化后的因子值。

市值中性化因为市值因子是连续的,所以采用的是回归取残差法,因子值作为y,市值作为x。

二、因子收益率向量的估计

因子找好之后,就进入了估计因子收益率的部分了。在barra的框架中,因子收益率通常是日数据。

利用第二部分的公式

因子暴露X已知,因子收益率R已知,所以针对每一天的截面数据进行回归,X取当天的因子值,R取下一天因子的收益率。就可以估算出当天的因子收益率了。

当然,有个非常关键的问题,又扯到之前的假设上来了。Barra模型认为,每只股票的特质收益率u不相关,这个假设在计量经济学的理论框架里,造成了一个非常明显的问题,异方差性。那么怎么估计因子收益率呢,只能用WLS方法了(加权最小二乘)。问题又来了,加权最小二乘的算法中,权重怎么取?通常的计量经济学方法是取残差平方的倒数,但是barra模型中,这个权重取了根号市值,这个问题是个玄学。利用WLS方法,可以得到因子收益率的最终表达式:

其中W是加权最小二乘法的权矩阵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值