人工智能(AI)技术得到了飞速发展,其在各个领域的运用也不断取得成果。机器学习被评为人工智能中最能体现人类智慧的技术,因此开发AI量化策略可以理解为将机器学习应用在量化投资领域。
理解机器学习算法——以StockRanker为例
机器学习算法太多,本文讨论只针对适用于金融数据预测的常用有监督型机器学习(Supervised Machine Learning)算法:StockRanker。假设我们要去预测某个连续变量$ Y 未 来 的 取 值 , 并 找 到 了 影 响 变 量 未来的取值,并找到了影响变量 未来的取值,并找到了影响变量 Y 取 值 的 取值的 取值的K$ 个变量,这些变量也称为特征变量(Feature Variable)。机器学习 即是要找到一个拟合函数 f ( X 1 , X 2 , … , X K ∣ Θ ) f(X_1,X_2,\ldots,X_K|\Theta) f(X1,X2,…,XK∣Θ)去描述 Y Y Y和特征变量之间的关系, Θ \Theta Θ为这个函数的参数。
要找到这样的函数,必须要足够量的观测数据,假设有 N 个样本数据$ { y_1,y_2,\ldots,y_n }$和 x 1 i , x 2 i , … , x K i x_{1i},x_{2i},\ldots,x_{Ki} x1i,x2i,…,xKi(其中 i = 1 , 2 , … , n i=1,2,\ldots,n i=1,2