最近在学习使用sklearn和TensorFlow,利用模块或框架实战练习机器学习项目。由于本人工作中的建模项目大多为回归类,因此从回归类的项目着手,实操相应的回归算法。
常见的机器学习回归算法(sklearn)
- 线性回归(LinearRegression)
- 决策树回归(DecisionTreeRegressor)
- SVM(SVR)
- KNN(KNeighborsRegressor)
- 随机森林(RandomForestRegressor)
- Adaboost(AdaBoostRegressor)
- GBRT(GradientBoostingRegressor)
- Bagging(BaggingRegressor)
- ExtrTree极端决策树回归(ExtraTreeRegressor)
项目概述
火力发电的原理是利用燃料燃烧后产生的蒸汽推动发电机旋转,从而产生电能。因此蒸汽量的多少,直接决定了电能多少,而锅炉燃烧的各个条件(锅炉的可调参数、锅炉的工况等)影响了蒸汽量的产生。
项目组织方提供了发电生产过程中的38个工况数据,以及对应的蒸汽量。通过模型训练,利用测试集的工况数据,预测蒸汽量。
预测结果以均方根误差(mean_square_error)作为评判标准。
竞赛原址:https://tianchi.aliyun.com/competition/entrance/231693/information