以太坊庞氏骗局检测与分子生物活性预测研究
以太坊庞氏骗局检测
- 数据集构建
- 构建了两个数据集,一个保持庞氏和非庞氏合约的数据平衡(比例为191:191),另一个保持数据不平衡(比例为191:1152)。平衡数据集的负样本通过三次随机抽样获得。具体数据集属性如下表所示:
| 数据集 | |V| | |E| | K | 比例 | 标签率(%) |
| — | — | — | — | — | — | — |
| Data ba1 | 62,151 | 71,587 | 2.30 | 191: 191 | 0.61 |
| Data ba2 | 48,416 | 56,175 | 2.32 | | 0.79 |
| Data ba3 | 59,109 | 70,092 | 2.37 | | 0.64 |
| Data unba | 203,215 | 304,809 | 3 | 191: 1151 | 0.66 | - 注:|V|和|E|分别是节点和边的数量,K是平均度。
- 构建了两个数据集,一个保持庞氏和非庞氏合约的数据平衡(比例为191:191),另一个保持数据不平衡(比例为191:1152)。平衡数据集的负样本通过三次随机抽样获得。具体数据集属性如下表所示:
- 对比方法
- 手动特征工程依赖高性能的下游分类器来实现良好的任务性能,使用了七种集成学习模型,包括XGBoost分类器(XGB)、多层感知器(MLP)、AdaBoost分类器(ADA)、决策树分类器(DTC)、随机森林分类器(RFC)、梯度提升决策树(GBC)和逻辑回归(LR),直接学习手动特征到账户身份的函数映射。
超级会员免费看
订阅专栏 解锁全文
901

被折叠的 条评论
为什么被折叠?



