以低频数据为例,对REDD数据集进行分析。
REDD数据文件的内容
当我们下载完REDD数据集并解压缩后,便得到了一个文件夹,其中包含了6个house,每个house内分别有不同的channel文件,以及一个label文件。REDD的数据集压缩文件大小为100多兆,解压缩为文件后大小为800多兆,通过NILMTK的格式转换工具转换为.h5文件后,大小为300多兆。
channel文件内只有两列数据,第一列是时间,第二列是功率。时间采用UTC时间戳,功率分为两种,一个是房间的总功率,一个是每个仪表的功率。房间的总功率是视在功率,单独仪表的功率是有功功率。
疑惑1
当我们使用NILMTK读取REDD数据集后,有一个.metadata函数,能够显示REDD数据集的信息,包括REDD的全称、作者、作者所在地等等信息。
莫非这些信息是NILMTK自带的?
在低频数据文件种并没有这些数据啊。
疑惑2
在building1中共有20个channel,使用NILMTK读取后,显示电器如下:
MeterGroup(meters=
ElecMeter(instance=1, building=1, dataset='REDD', site_meter, appliances=[])
ElecMeter(instance=2, building=1, dataset='REDD', site_meter, appliances=[])
ElecMeter(instance=5, building=1, dataset='REDD', appliances=[Appliance(type='fridge', instance=1)])
ElecMeter(instance=6, building=1, dataset='REDD', appliances=[Appliance(type='dish washer', instance=1)])
ElecMeter(instance=7, building