一、机器学习步骤
一般的步骤为:
1)数据采集与标记
2)特征选择
3)数据清洗
4)模型选择
5)模型训练
6)模型性能评估与优化
二、sklearn--svm
1、数据采集
from sklearn import datasets
digits = datasets.load_digits()
2、模型训练
# 划分数据为训练集与测试集
from sklearn.model import train_test_split
Xtrain, Xtest, Ytrain, Ytest = train_test_split(digits.data, digits.target, test_size=0.2, random_state = 2)
# 训练模型
from sklearn import svm
clf = svm.SVC(gamma = 0.001, C=100.)
clf.fit(Xtrain, Ytrain)
3、模型测试
clf.score(Xtest, Ytest)
4、模型保存与加载
# 模型保存
from sklearn.externals import joblib
joblib.dump(clf, 'digits_svm.pkl')
# 模型加载
clf = joblib.load('digits_svm.pkl')
Ypred = clf.predeict(Xtest)
clf.score(Ytest, Ypred)