多银行欺诈检测的许可区块链 XGBoost 方法
1. 引言
在机器学习训练中,传统的集中式训练存在数据隐私和安全问题,而分散式训练成为了一种新的解决方案。分散式训练有多种方法,如联邦学习(FL)和群体学习(SL)。本文提出了一种在许可区块链网络中开发完全分散式 XGBoost 模型的方法,旨在解决银行交易数据欺诈检测中的数据不平衡和隐私保护问题。
2. 问题陈述
在银行客户交易数据的欺诈检测训练过程中,存在以下问题:
- 数据不平衡 :欺诈数据在整体交易数据中占比小,导致数据不平衡问题。
- 数据隐私 :各银行需要保护客户数据隐私,禁止共享原始数据集,但又希望通过合作共享聚合模型来提高预测性能。
3. 相关工作
3.1 XGBoost
XGBoost 是梯度提升决策树(GBDT)算法的高效可扩展实现,基于损失函数的函数逼近和正则化。对于有 n 个样本和 m 个特征的数据集 $D = {(x_i, y_i)}(|D| = n, x_i \in R^m), y_i \in R$,假设第 t 个决策树 $f_t$ 用于最小化目标函数 $L_t$:
$L_t = \sum_{i=1}^{n} l(y_i, \hat{y} i^{(t - 1)} + f_t(x_i)) + \Omega {f_t}$
其中,目标函数由训练损失 $\sum_{i=1}^{n} l(y_i, \hat{y} i^{(t - 1)} + f_t(x_i))$ 和正则化 $\Omega
超级会员免费看
订阅专栏 解锁全文
39

被折叠的 条评论
为什么被折叠?



