德国信用数据集的模型评估与预测
在处理不平衡分类问题时,我们需要评估不同的技术和模型,以找到最适合数据集的解决方案。本文将围绕德国信用数据集展开,介绍如何评估机器学习算法、使用欠采样技术提升性能,以及如何利用最终模型对新数据进行预测。
1. 评估机器学习算法
为了快速找出哪些算法在德国信用数据集上表现良好,值得进一步研究,我们将评估一系列概率机器学习模型。具体评估的模型如下:
- 逻辑回归(LR)
- 线性判别分析(LDA)
- 朴素贝叶斯(NB)
- 高斯过程分类器(GPC)
- 支持向量机(SVM)
以下是定义待评估模型的代码:
# define models to test
def get_models():
models, names = list(), list()
# LR
models.append(LogisticRegression(solver='liblinear'))
names.append('LR')
# LDA
models.append(LinearDiscriminantAnalysis())
names.append('LDA')
# NB
models.append(GaussianNB())
names.append('NB')
# GPC
models.append(GaussianProcessClassifier())
names.append('GPC')
# SVM
models.a
超级会员免费看
订阅专栏 解锁全文
3928

被折叠的 条评论
为什么被折叠?



