0 前言
几种方法对比做该数据集的回归分析: github代码
文件说明:
- LR_global_path.py 全局文件路径
- readdata.py 读取数据,简单的特征统计显示
- LR_linreg.py 普通线性回归
- Ensembleplot.py 集成回归
- fullNet.py 全连接神经网络
该数据集是收集于联合循环发电厂的9568个数据点, 共包含5个特征: 每小时平均环境变量温度(AT),环境压力(AP),相对湿度(RH),排气真空(V)和净每小时电能输出(PE), 其中电能输出PE是我们要预测的变量。
数据:介绍地址 下载地址
普通的回归:
- 线性回归(LinearRegression)
- 岭回归(RidgeCV、Ridge)
- 支持向量机线性回归(svm.SVR(kernel=‘linear’))
集成回归学习方法:
- 随机森林回归(RandomForestRegressor)
- 极端树回归(ExtraTree