机器学习在回归与学生辍学预测中的应用
1. OAGRE回归器的实现与评估
在机器学习领域,处理具有异方差性的数据是一个常见的挑战。为了解决这个问题,研究人员提出了一种名为Outlier Attenuated Gradient Boosted Regression(OAGRE)的算法。
1.1 OAGRE回归器的实例化与训练
可以使用 sklearn 的 DecisionTree 模型作为基分类器和回归器来实例化和训练OAGRE回归器。该实现允许将OAGRE集成模型包含在 scikit-learn 的管道中,这样可以将OAGRE模型构建为一个单一的序列化模型,便于部署,还能包含数据预处理阶段。
OAGRE库可以通过以下两种方式安装:
- 从PyPi仓库安装: pip install oagre
- 直接从源代码安装: https://github.com/john-hawkins/oagre
1.2 实验评估
为了评估OAGRE方法的有效性,研究人员进行了一项实验,创建了大量具有不同异方差性参数化的合成数据集。实验参数如下表所示:
| 参数 | 描述 | 值 |
|---|---|---|
| 数据集大小 | 数据集中的记录数 | <
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



