金融科技中的机器学习应用与趋势
在金融科技领域,机器学习技术正发挥着越来越重要的作用。本文将介绍几种常见的机器学习方法,包括最小绝对收缩和选择算子(LASSO)、主成分回归(PCR)、线性判别分析(LDA)、二次判别分析(QDA)以及交叉验证等,旨在帮助读者了解这些方法的原理、应用场景和优缺点。
1. 最小绝对收缩和选择算子(LASSO)
岭回归虽然能将所有系数向零收缩,但除非 λ 趋于正无穷,否则系数不会变为零。这导致即使某些系数接近零,所有预测变量仍会包含在模型中,使得模型难以解释。而 LASSO 方法可以通过特征选择解决这个问题。
LASSO 不是通过系数的平方来约束,而是对系数的绝对值进行惩罚,其目标函数为:
[SSE + \lambda\sum_{k=1}^{p}|\beta_{k}|]
这种收缩惩罚可以在特定的调整参数 λ 下,迫使某些系数恰好为零。从优化的角度来看,使用绝对值约束,最优解可以在某些尖锐的角点处实现,此时某些系数恰好为零。当某个系数的估计值为零时,对应的预测变量将从拟合模型中移除,从而实现特征选择的目的。
2. 主成分回归(PCR)
主成分回归基于主成分分析(PCA)技术,将主成分作为新的预测变量,使用最小二乘法拟合线性回归模型。
2.1 主成分分析(PCA)
PCA 是一种降维技术,用于处理具有多个变量的数据集。它可以识别数据高度变化的方向,这些方向就是主成分,它们总结了所有变量的代表性信息。
PCA 的实施步骤如下:
1. 计算质心点 :根据给定的观测值,计算每个预测变量方向
超级会员免费看
订阅专栏 解锁全文
1249

被折叠的 条评论
为什么被折叠?



