笔记:VF2Boost
VF2Boost: Very Fast Vertical Federated Gradient Boosting for Cross-Enterprise Learning
优化现有的SecureBoost方案,实现速度和规模的提升
场景
两企业持有两个数据集,列属性(特征)不同,有部分行(实例)重叠,且只有B方持有标签。目标是在数据不互通的情况下训练模型

1 GBDT
梯度提升决策树:通过训练一群弱学习者得到一系列决策树,然后利用提升的策略对模型进行改进
1.1 损失函数
对第t棵树来说,目的是最小化损失函数:

Friedman提出的一种实现是

其中gi是梯度