用Scikit-Learn(sklearn)建立模型
1 环境搭建
Python 3+NumPy+Pandas+Scikit-Learn (sklearn)
2 导入库和模块
Numpy是比Python自身的嵌套列表(nested list structure)结构要高效的多的一种开源的数值计算扩展。NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。
Pandas(Python Data Analysis Library)是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
-
import numpy as np
-
import pandas as pd
-
-
from sklearn.model_selection import train_test_split
-
from sklearn import preprocessing
-
from sklearn.ensemble import RandomForestRegressor
-
from sklearn.pipeline import make_pipeline
-
from sklearn.model_selection import GridSearchCV
-
from sklearn.metrics import mean_squared_error,r2_score