本文为 「茶桁的 AI 秘籍 - BI 篇 第 12 篇」

文章目录
Hi, 你好。我是茶桁。
我们今天继续来看数据可视化做数据探索,今天我们还是来看相关项目。来看看可视化 EDA 在项目中的应用。
工业蒸汽量预测
接下来这个项目,是在阿里天池上的一个工业蒸汽量的预测项目。
首先我们来看一下一些前提知识点。我们知道,火力发点的原理是:燃料加热水 -> 生成蒸汽 -> 推动汽轮机旋转 -> 带动发电机旋转 -> 产生电能。

在这个过程中,影响发电效率的核心是锅炉的燃烧效率。影响锅炉燃烧效率的主要因素包括:
- 锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量。
- 锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。
很明显,我们要通过调节的锅炉的参数以及锅炉工况的参数来去预测它的蒸气量会是多少。
这个项目的训练集为zhengqi_train.txt,测试集为zhengqi_test.txt,数据都是脱敏后的传感器采集数据(采集频率为分钟级)。训练集大概 38 个字段。
先大概来看一下这个数据,现在要做的事情是根据锅炉的情况来预测它的蒸汽量,蒸汽量这个特征是在最后,也就是要去预测target这个值。

订阅专栏 解锁全文
1233

被折叠的 条评论
为什么被折叠?



