scikit-learn 中对机器学习算法的封装
sklearn统一用法
- 创建算法的实例
- 训练:fit
- 预测:predict
- 输出测试准确率:score(测试集输入,测试集标签) 对于回归模型,score会输出指标R方
输出测试准确率:test
KNN
分类模型
例子:
两种等价的查看准确率的方式
scalar
scikit-learn中使用scaler保存训练集得到的均值,方差等关键信息,用于对测试数据集进行transform
例子:
1,加载鸢尾花数据集
2,数据查看
然后standardScaler就是训练好的模型了,用transform方法就可以对测试数据进行同样的归一化操作
简单线性回归
原理
knn是分类算法,线性回归是回归算法
基于sklearn的实现
评价回归算法的指标:MSE,RMS,MAE
MSE:即L2损失,误差平方的均值,均方误差
RMSE:均方根误差,即mse开平方
MAE:即L1损失,绝对损失,绝对差损失,平均绝对误差
sklearn中实现MSE和MAE
最好的衡量线性回归的指标R-Squared
读作R方
下面的用法与线性回归(sklearn.linear_model.LinearRegression)中的score功能相同
多元线性回归
有多个特征
不需要对数据进行归一化处理即可得到解
sklearn对线性回归的封装sklearn.Linear_model.LinearRegression
sklearn.Linear_model.LinearRegression