1.scikit-learn
加载示例数据集
lris
digits
在训练集上训练模型
svm模型
.fit()训练模型
在测试集上测试模型
.perdict()进行预测
保存模型
pickle.dumps()
2.准备数据集
数据处理:
数据集格式;
二维数组,形状(n_samples, n_features)
使用np.reshape()转换数据集形状
特征工程:
特征提取;
特征归一化
train_test_split() 分割训练集、测试集
特征归一化:
preprocessing.scale()
3.训练模型
Estimator对象;
从训练数据学习得到的;
可以是分类算法、回归算法或者是特征提取算法;
fit方法用于训练Estimator;
Estimator的参数可以训练前初始化,或者之后更新;
get_params()返回之前定义的参数;
score()对Estimator进行评分:
回归模型:使用决定系数评分(Coefficient of Determination)
分类模型:使用准确率评分(accuracy)
4.调整参数
依靠经验;
依靠实验,交叉验证(cross validation)
cross_val_score()