机器学习模型选择、训练与调优全流程指南
1. 选择和训练模型
在完成问题定义、数据获取与探索、训练集和测试集划分以及数据转换流水线搭建后,我们终于可以开始选择和训练机器学习模型了。
1.1 在训练集上训练和评估
1.1.1 线性回归模型
首先,我们训练一个线性回归模型,代码如下:
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(housing_prepared, housing_labels)
然后,我们在训练集的几个实例上进行测试:
some_data = housing.iloc[:5]
some_labels = housing_labels.iloc[:5]
some_data_prepared = full_pipeline.transform(some_data)
print("Predictions:", lin_reg.predict(some_data_prepared))
print("Labels:", list(some_labels))
接着,使用 Scikit-Learn 的 mean_squared_error() 函数计算该回归模型在整个训练集上的 RMSE:
机器学习模型全流程调优指南
超级会员免费看
订阅专栏 解锁全文
1900

被折叠的 条评论
为什么被折叠?



