第十五周作业

最新推荐文章于 2022-12-22 03:02:56 发布

原创最新推荐文章于 2022-12-22 03:02:56 发布 · 282 阅读

0 ·

CC 4.0 BY-SA版权

高级编程技术作业专栏收录该内容

15 篇文章

订阅专栏

本文通过实验对比了三种常见的机器学习算法：高斯朴素贝叶斯、支持向量机和服务于随机森林分类器。通过对准确率、F1得分及AUC-ROC等指标的评估，分析了各算法的性能表现。

【题目要求】

【代码】

from sklearn import datasets
from sklearn import cross_validation
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn import metrics

dataset = datasets.make_classification(n_samples=1000, n_features=10)
X,y = dataset
kf = cross_validation.KFold(len(dataset[0]), n_folds=10, shuffle=True)

acc_average, f1_average, auc_average = [0,0,0],[0,0,0],[0,0,0]

for train_index, test_index in kf:
    X_train, y_train = X[train_index], y[train_index]
    X_test, y_test   = X[test_index],  y[test_index]

    # GaussianNB
    clf = GaussianNB()
    clf.fit(X_train, y_train)
    pred = clf.predict(X_test)

    acc_average[0] += metrics.accuracy_score(y_test, pred)
    f1_average[0] += metrics.f1_score(y_test, pred)
    auc_average[0] += metrics.roc_auc_score(y_test, pred)

    # SVC
    clf = SVC(C=1e-02, kernel='rbf', gamma=0.1)
    clf.fit(X_train, y_train)
    pred = clf.predict(X_test)

    acc_average[1] += metrics.accuracy_score(y_test, pred)
    f1_average[1] += metrics.f1_score(y_test, pred)
    auc_average[1] += metrics.roc_auc_score(y_test, pred)

    # RandomForestClassifier
    clf = RandomForestClassifier(n_estimators=10)
    clf.fit(X_train, y_train)
    pred = clf.predict(X_test)

    acc_average[2] += metrics.accuracy_score(y_test, pred)
    f1_average[2] += metrics.f1_score(y_test, pred)
    auc_average[2] += metrics.roc_auc_score(y_test, pred)

train_methods = ['GaussianNB','SVC','RandomForestClassifier']
for method in train_methods:
    print(method + ":\nAccuracy:%f\nF1-score:%f\nAUC ROC:%f\n"%(acc_average[train_methods.index(method)]/10,f1_average[train_methods.index(method)]/10,auc_average[train_methods.index(method)]/10))

【运行结果】

# Average
GaussianNB:
Accuracy:0.904000
F1-score:0.902537
AUC ROC:0.904208

SVC:
Accuracy:0.924000
F1-score:0.922635
AUC ROC:0.924301

RandomForestClassifier:
Accuracy:0.968000
F1-score:0.967945
AUC ROC:0.967754

【结果分析】