机器学习模型选择、调优与部署全流程指南
1. 模型选择与初步评估
1.1 线性回归模型评估
在机器学习中,我们首先使用线性回归模型进行预测,并计算其均方根误差(RMSE)。代码如下:
from sklearn.metrics import mean_squared_error
lin_rmse = mean_squared_error(housing_labels, housing_predictions, squared=False)
print(lin_rmse)
运行结果显示, lin_rmse 为 68687.89176589991。大多数地区的房屋中位数价值在 120,000 美元至 265,000 美元之间,这样的预测误差并不理想,这表明模型可能对训练数据欠拟合。欠拟合可能是由于特征提供的信息不足,或者模型本身不够强大。
1.2 决策树回归模型尝试
为了解决欠拟合问题,我们尝试使用决策树回归模型。决策树是一种强大的模型,能够发现数据中的复杂非线性关系。代码如下:
from sklearn.tree import DecisionTreeRegressor
tree_reg = make_pipeline(preprocessing, DecisionTreeRegressor(random_state=42))
tree_reg.fit(housing, housing_labels)
housing_predi
机器学习模型全流程指南
超级会员免费看
订阅专栏 解锁全文
1937

被折叠的 条评论
为什么被折叠?



