QuanTide-weekly第1期

原创

于 2024-08-03 21:32:04 发布 · 1.3k 阅读

CC 4.0 BY-SA版权

文章标签：

这周我们共发表5篇文章。《基于 XGBoost 的组合策略…》等两篇详细讲解了机器学习构建组合策略的框架和常见问题。

文章要点与结论：

这两篇文章我们也集结后，发在本文末尾。

在这一期的量化工具专栏中，我们发表了获得NASA奖章的男人，带来了这些IPython技巧。IPython是非常轻量的交互式编程工具，尽管它的所有功能都可以在Notebook中找到，但它更轻，但仍然长袖擅舞，颇有飞燕之姿。

在不要去写书除非是要与你的灵魂交流中，我们披露了《Python高效编程实践指南》出版过程中的一些冏事。这本书会对量化人构建稳健的交易系统非常有帮助。

话音刚落，周五就发生了Windows蓝屏事件，正是因为CrowedStrike缺乏完善的CI/CD，才导致这一事件发生。而CI/CD正是本书详细介绍的内容之一。

在问薪无愧，最全威的量化自学路线图中，我们介绍了Algos.org编写的这份量化自学大纲。

我们也将在8月底前，推出自己的量化自学路线图。除了更好的本地化之外（英文版中，一些工具、网站和数据源对国内市场不支持），我们还将更清晰地理出从入门到精通、从小白到不同的岗位的学习路径。

在大纲没有出来之前，大家可以暂时参照这份路线图：

在这里插入图片描述

基于XGBoost构建多因子策略

如何在投资组合策略中运用上机器学习方法? 最近，我们翻了下之前存过的论文，决定对《A portfolio Strategy Based on XGBoost Regression and Monte Carlo Method》这篇论文进行解读。

这是论文抽象出来的一个基本框架图。

在这里插入图片描述

这个框架能解决的什么问题呢？我们知道，在一个投资组合策略中，要重点考虑的第一个问题是，如何从给定的 universe 中，选择一部分股票纳入策略股票池；其次要考虑，这部分股票的持仓如何分配，使之在这个组合上，达到风险收益比最高。

在这里插入图片描述

后一部分，最经典的方法就是运用 MPT 理论，寻找有效投资前沿。这里既可以用凸优化求解，也可以使用蒙特卡洛方案。这一部分，我们之前有一个系列文章：投资组合理论与实战，从基本概念到实战细节，都讲得非常清楚，这里就不详述了。

如何从 universe 中选择股票进入股票池？ 这在单因子模型中比较容易解决，就是选择因子分层中，表现最佳的那个分层 (tier) 的股票进入股票池。各标的的权重可以按因子载荷来分配，也可以使用 MPT 方法。

但如何在多因子模型中选择股票进入股票池？这一直是一个难题。我们常常提到的 Barra 模型也只是一个风控模型，并不能选择出最佳的股票池出来。

论文的思路是，将股票的纳入选择看成一个回归问题，即，通过多因子的训练，找出最能被模型预测的那些股票进入股票池。

作者给出的结果是，在 2021、2020 和 2019 年，龙头股票投资组合的回报率分别为 27.86%， 6.20%和 23.26%。不过，作者并没有给出基准比较，此外，也没有深入分析，如果这些结果有超额收益的话，这些超额是来自于 MPT 呢，还是来自于 XGBoost。

这也是我们要对这篇