Anomalies,Factors,andMultiFactorModels

本文探讨了金融市场中的异象、因子及多因子模型,解释了它们之间的区别和联系。异象是多因子模型无法解释的股票收益率,因子是从异象中筛选出的能解释资产收益率差异的部分。多因子模型旨在找到一组因子来解释资产定价。通过统计分析,发现大部分异象可能是数据挖掘的结果,真正的因子寥寥无几。主流的多因子模型包括Fama-French三因子、Carhart四因子等。文章强调了模型复杂度与解释力之间的权衡,提供了比较模型的统计方法。

转 Anomalies, Factors, and Multi-Factor Models

作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。

摘要:本文解释了异象、因子以及多因子模型的区别和联系;梳理了从异象到因子再到模型背后的逻辑;介绍了学术界研究多因子模型的主流统计手段。

1、引言

在 empirical asset pricing 和 factor investing 中,anomalies(异象)、factors(因子)以及 multi-factor models(多因子模型)是三个常见的概念。从这些概念出发又能很自然的引发出一系列问题:

1. 什么是 anomalies;什么是 factors?

2. Anomalies 和 factors 有什么区别?

3. 一个 multi-factor model 中应该包含多少个 factors?

4. 学术界有哪些主流的 multi-factor models?

5. 如何比较并在不同的 multi-factor models 之间取舍?

在过去几十年里,海外学术界对上述问题进行了大量的探索,留下了很多宝贵的实证结果和分析手段。而对于像你、我一样进行因子投资的投资者来说,搞清楚这些问题对于构建系统和全面的因子投资分析体系至关重要。本文试图回答上述五个问题。

在开始之前,先来唠两句标题。这是我第一次使用纯英文标题,倒是也没有什么特别的原因。对于文章标题,我一贯的看法是杜绝惊世骇俗,只求言简意赅、切中要害,再有就是“读来有感觉”。本文的标题翻译中文是“异象、因子和多因子模型”,实在平淡无奇,所以就索性用英文了。

2、Anomalies

多因子模型是 empirical asset pricing 的一种常见方法;其研究的核心问题是找到一组能够解释股票预期收益率截面差异的因子(见《股票多因子模型的回归检验》)。假使我们根据基本面特征或量价指标(或 whatever,下面统称为特征)挑选出一揽子股票并构建多空投资组合;如果该组合的收益率无法被用于 asset pricing 的多因子模型解释,则称该特征为一个异象(anomaly)。

在数学上,这意味着该组合有模型无法解释的 α 收益率:以使用该特征构建的多空组合收益率为被解释变量放在回归方程的左侧,以多因子模型中因子收益率为解释变量放在回归方程的右边,进行时序回归,回归的截距项就是 α 收益率;如果 α 显著不为零,则说明该特征是一个异象。

举个例子。《获取 α 的新思路:科技关联度》一文介绍了 Lee et al. (2018) 这篇文章;使用科技关联度选股的多空对冲投资组合获得了主流多因子模型无法解释的 α 收益率(下图),因此它是一个异象。

从有效市场假说的观点出发,市场中不应该存在很多异象。当然,有效市场假说并不完美,再加上学术界几十年来的“不懈努力”,针对美股挖掘出了 400+ 个异象,这些异象在样本内的统计检验中都获得了很高的 t-statistics。

产生如此多的异象主要有两个原因:

第一个也是最主要的一个原因是数据挖掘。在 p-hacking 的激励和 multiple testing 的盛行下,大量所谓的异象在样本内被挖出。Har

### 关于软件或数据处理中的异常修订 在软件工程和数据分析领域,异常检测与修正是一项至关重要的任务。当提到异常(anomalies),通常指的是那些偏离预期模式的数据点或者行为[^2]。 #### 异常检测方法概述 为了有效识别并处理这些异常情况,在计算机科学中有多种技术被广泛应用: - **统计学方法**:基于历史数据建立正常范围的标准模型,任何超出此界限的情况都将被视为潜在的异常。 - **机器学习算法**:通过训练监督式或无监督式的分类器来区分正常的活动模式与不寻常的行为特征。例如,支持向量机(SVM),随机森林(Random Forests)等可以用于构建预测模型以发现异常实例。 - **时间序列分析**:对于具有时间维度的数据集来说,ARIMA、LSTM神经网络等能够捕捉到趋势变化规律从而帮助定位突变事件作为可能存在的异常状况。 一旦确认了某个特定类型的异常之后,则需要对其进行相应的修复措施。这涉及到对原始代码逻辑进行审查、调整参数设置或是重新设计某些功能模块等方面的工作。此外,还需要考虑如何防止未来再次发生类似的错误,比如加强输入验证机制、优化性能瓶颈等问题。 针对上述提及的技术手段而言,每一次改进都意味着一次新的“修订”。这种修订不仅限于简单的修补程序缺陷,更包含了提升系统的鲁棒性和自适应能力等方面的增强工作。 ```python def detect_anomaly(data_series): """ A simple function to demonstrate anomaly detection using statistical methods. :param data_series: List of numerical values representing a time series dataset :return: Boolean indicating whether an anomaly was detected within the given sequence """ mean_value = sum(data_series)/len(data_series) std_deviation = (sum((x-mean_value)**2 for x in data_series)/len(data_series))**(0.5) threshold = 3*std_deviation return any(abs(x - mean_value)>threshold for x in data_series) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值