官方地址
http://stick-learn/org/
中文文档地址
http://sklearn.apachecn.org/
安装stick-learn
windows:pip install stick-learn
mac:pip3 install stick-learn
鸢尾花分类(stick-learn自带数据)
from sklearn import datasets
#直接load_iris()即可获取自带数据
iris=datasets.load_iris()
利用pyecharts的3D散点图查看
#自行利用最新的pyecharts方法
LinearSVC是SVM的一种
from sklearn import svm
from sklearn.model_selection import train_test_split
x=iris.data
y=iris.target
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3,random_state=0)
#train_test_split可以将数据分为两个部分,一部分为train:训练用数据,一部分为test:测试用数据
#test_size可以调节训练和测试数据比例,random_state可以确保切分状态一致
数据训练
创建一个linearSVC分类器
clf=svm.LinearSVC() #创建分类器/回归器等
clf.fit(x_train,y_train) #XXX.fit(训练数据输入值,对应的正确结果) XXX.predict(待检测数据输入值)
模型得分
print(‘得分:{}’.format(clf.score(x_test,t_test))) #得分=正确数量/数据总数
利用模型预测
y_predict=clf.predict(x_test)
波士顿房价预测任务
#stick-learn自带数据,总共506个数据,共有13个属性,需要预测房价
boston=datasets.load_boston() #获取数据
print(boston.DESCR) #获取数据说明
绘制散点图直观观看
导入模块
from sklearn import linear_model
创建回归器并训练
lasso=linear_model.Lasso()
lasso.fit(x_train,y_train)
引入均方差
from sklearn.metrics import mean_squared_error
mse=mean_squared_error(y_test,lasso.predict(x_test))
score=lasso.score(x_test,y_test)
print(‘MSE:{}’.format(mse))
print(‘SCORE:{}’.format(score))
调节参数,可以在文档中查看
lasso=linear_model.Lasso(alpha=0.1)
利用stick-learn的网络搜索调节参数
from sklearn.model_selection import GridSearchCV
import numpy as np
alpha_range=np.arrange(0.1,0.05) #一0.5为步长,从0到0.1
param_grid={‘alpha’:alpha_range}
lasso_search=GridSearchCV(lasso,param_grid)
lasso_search.fit(x_train,y_train)
for result in lasso_search.cv_results_:
print(result,lasso_search.cv_results_[result])
print(lasso_search.best_score_)
print(lasso_search.best_param_)
print(lasso_search.best_estimator_)
学习链接:https://www.bilibili.com/video/BV197411f7Rp
本文介绍了如何使用stick-learn进行机器学习,包括鸢尾花数据集的分类和波士顿房价预测。通过LinearSVC实现SVM分类,使用Lasso回归器进行房价预测,并探讨了参数调整的方法,如GridSearchCV。
1万+

被折叠的 条评论
为什么被折叠?



