机器学习入门训练3-从KNN引申出的几个API

JIM-207

于 2021-06-01 10:35:30 发布

阅读量94

点赞数

文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/weixin_44717598/article/details/117390943

版权

这篇博客介绍了KNN算法的基础应用，包括使用交叉验证（cv=3）评估不同邻居数（k范围1-30）下的模型精度，并展示了如何划分训练集和测试集来评估模型性能。此外，还详细讲解了如何使用pickle和joblib库保存及加载模型，以备后续使用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

KNN的基本用法

1.交叉验证。

...
k_range = range(1, 31)
k_scores = []
for k in k_range:
    knn = KNeighborsClassifier(n_neighbors=k)
    scores = cross_val_score(knn, X, y, cv=3, scoring='accuracy')
    k_scores.append(scores.mean())

2.训练集和测试集的划分函数，及评分函数。

...
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=4)
for k in range(2,30):
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)
    print(knn.score(X_test, y_test))

3.模型保存和提取。

...
import pickle
with open('save/clf.pickle', 'wb') as f:
    pickle.dump(clf, f)
with open('save/clf.pickle', 'rb') as f:
   clf2 = pickle.load(f)
   print(clf2.predict(X[0:1]))

from sklearn.externals import joblib
joblib.dump(clf, 'save/clf.pkl')
clf3 = joblib.load('save/clf.pkl')
print(clf3.predict(X[0:1]))