基于多目标分类的家电能耗预测

原创于 2025-10-29 03:44:55 发布 · 704 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#非侵入式负荷监测 # 多目标分类 # 功率状态识别 # 能源预测 # 智能电表

一种用于家用电器非侵入式负荷监测的能源预测方法

摘要

通过设备级信息进行家庭能源监控，可为消费者提供节能意识。该系统可通过智能电表实现，但需要高效的数据分析算法来提供精确的能耗轮廓，以实现适当的家庭能源管理。本文提出了一套从电器功率消耗数据中提取电器功率状态的数据分析流程。该方法基于多目标分类，一种用于非侵入式负荷监测的新型数据学习框架。该流程包括：1）使用K‐均值聚类将电器功率数据划分为有效的功率状态数；2）利用ROC曲线下面积指数确定最佳功率状态数量。设计目标是获得最优的预测性能，以识别电器功率状态，从而实现准确的功率和能耗预测。采用基于决策树的随机k标签集（Random k‐Labelsets）按不相交子集的多目标分类算法，对空调和热水器等高功率负载的电器功率状态识别，其F分数和准确率值均超过89%。在功率预测方面，其归一化误差值优于因子隐马尔可夫模型和二元状态建模系统的使用表现。

索引术语

家庭能源管理，非侵入式负荷监测，智慧能源，智能电表

I. 引言

能源效率是在为家庭用户提供恒定服务或可接受的舒适水平的同时，降低能耗的关键措施之一[1]。为了确定有效的措施，消费者应具备关于其能耗特征的正确认知，以建立适当的决策标准来减少能源消耗。研究表明，当居民获取设备级的能耗信息时，相较于接收传统的建筑级月度信息，最多可节省12%的能源成本[2]。

各电器的能耗信息可以帮助消费者管理家庭中的能源使用。因此，通过适当控制高功率电器，将形成一种有效的节能计划。例如，能源管理方案包括降低负载运行水平或将这些电器的使用推迟到非高峰时段[2, 3]。识别电器在使用中的功率和能耗的另一个好处是，可为预测性维护[4, 5]提供关键信息，以维持负载运行的效率和安全。

特定电器的能耗信息可以通过用于家庭能源监控系统的智能电表来实现。一种能够支持该系统的新技术是能量分解或非侵入式负荷监测（NILM），该技术通过应用一组机器学习算法，从主进线电路处的总电力消耗数据中分解出电器类型和行为。因此，相比于传感器分布式测量系统，单点测量系统可以节省硬件和安装成本。NILM操作包括三个过程：数据采集、特征提取以及数据学习与推断[6]。开发学习系统的一个挑战是如何从主电表的有效数据中准确推导出每个电器的运行状态，以进一步推断其功率和能耗数据。

II. 相关工作

NILM系统的开发大多依赖于基于事件的方法来检测开关事件，并利用功率阶跃变化作为稳态特征[7‐10]，或检测通电瞬态模式[11‐15]，学习电器的存在状态为二元功率状态模型（“开启”或“关闭”），后者声称比使用稳态特征能提供更好的负荷识别效果。然而，为了获取瞬态特征，需要使用具备时频数据分析能力的高频电表，导致系统计算成本较高。另一种二元功率状态学习依赖于非侵入式基于事件的方法，将聚合数据分解为在未检测开关事件的情况下，组合电器状态。因此，该方法可结合低频采样数据使用，并能够学习具有相似功率消耗或重叠的开机功率数据的电器，从而克服了基于事件技术的局限性。该方法采用模式分类技术，通过单输出学习[16‐18]或基于多标签分类的多输出学习方法[19, 20]实现二元状态识别（“1”/“0”）。二元状态模型对于识别功率消耗相对恒定的电器（如灯或烤面包机）的开启/关闭状态具有合理的性能。然而，许多电器具有多种机器操作，其功率消耗范围较宽，例如洗衣机或热水器。因此，简单的二元状态模型在负荷监测应用中不够精细，尤其是在估计电器功率和能耗数据方面。为此引入了多状态建模，常用方法基于因子隐马尔可夫模型（FHMM），其中每个电器被建模为一个离散隐状态。功率消耗通过预测功率状态[21]进行统计推断。然而，这些方法在概率建模过程中需要高计算复杂度。此外，这些方法的预测性能仅为中等水平，由于原生无监督学习的限制，报告的准确率在13‐70%[22, 23]之间，冰箱和空调的能耗预测归一化误差范围为21‐77%[24]。

近年来，非侵入式负荷监测（NILM）的发展高度关注使用深度神经网络（DNN）的无监督学习系统，该方法在人工智能的许多子领域取得了成功。在构建功率分解模型时，已探索了一些主要的网络架构，例如：卷积神经网络（CNN）[25‐27],、循环神经网络（RNN）[27],，其重点是通过电器激活序列来学习高功率电器。此外还包括自编码器[28]和长短期记忆网络（LSTM）[26, 29]。由于DNN具备有用特征的自动提取能力，并可通过迁移学习提升系统可扩展性，因此该方法具有广阔前景。然而，这种方法需要大量的训练样本，才能为未见数据[30]建立良好的泛化模型。

本文提出了一种用于非侵入式负荷监测（NILM）应用的多目标分类框架[31]新方法。该方法具有同时对多个输出进行数据预测的特性，其中每个输出取自一组离散值，因此可应用于识别电器的细粒度功率状态。该方法是一种有监督非基于事件的学习方法，且是一个可用于多输出数据分类的通用平台，能够处理二元状态与多状态建模。本研究通过实验设计构建了监督学习系统，通常相较于无监督方法具有更优的预测性能。设计目标是从电器功率数据中提取功率状态，并实现最优性能功率状态识别。本工作的主要贡献总结为以下两点： (1)提出了一种新应用于非侵入式负荷监测应用（NILM application）的多目标分类方法。利用该方法，每个电器标签可映射到每个预测输出，以多状态模型表示电器功率状态。相比传统的二元功率状态模型，该模型能够更准确地进行功率和能耗估计。（2）指定两种数据分析流程，用于从功率消耗数据中提取电器功率状态。首先，采用K‐均值聚类将电器功率数据划分为有效的功率状态数；其次，通过AUC优化来确定最佳功率状态数量。这些流程旨在为电器功率状态的最优预测性能提供学习数据。

示意图0 二元功率状态模型与(b) 所提出的多功率状态（3态通电状态）模型的示意图比较)

III. 提出的机器学习方法

多目标或多维分类是一种监督学习系统，其中每个数据实例由输入特征(X)和相关的类别输出(Y)集合组成。每个类别输出(Υi) 可以取若干预定义离散值(Υi ∈{1, 2,…, C}，其中C是每个输出[31, 32]的类别总数C。该分类方法在各种文本挖掘和图像分类应用中受到越来越多的关注[33]。

多目标分类框架能够表示非侵入式负荷监测问题（NILM），其目标是从聚合数据输入中预测在用电器的类型和行为作为多输出数据。数据处理分为数据训练和数据测试阶段。数据训练阶段旨在通过功率状态处理过程得到的多目标数据集来构建预测模型。数据测试阶段将预测模型用于分析新聚合数据，以估计功率状态、功率和能耗。该预测模型是应用于现场智能电表的软件。图2 (a) 和 (b) 分别显示了每个过程的功能模块。

A. 数据采集 (DAQ)

数据采集在泰国曼谷的一栋房屋中进行，相关数据集是公开的[34]。图3展示了使用多回路电表在负载分配处进行数据采集的设置。

示意图1 数据训练阶段；(b) 所提出的多目标分类系统的数据测试阶段)

示意图2

面板。收集的数据用于在训练阶段构建分类模型。此过程包含五个电气参数：电压(V)、有功功率(P)、无功功率(Q)、电流(I)和功率因数(PF)，数据分辨率为一分钟间隔，以展示低频测量系统。

测量通道列表如表I所示，包含一个总电路标签和其他十个有源子电路负载。这些标签可简要分为三类：照明、插座负载，以及各自包含一个电器的热水器和空调电路通道。

表I 每个电路的电器列表

No.	电器标签	设备描述
1	AGG	聚合通道
2	LHL	客厅照明
3	LHK	厨房照明
4	LHB1	卧室1照明
5	LHB2	卧室2照明
6	PLL	客厅插座负载
7	PLK	厨房插电负载
8	PLB1	卧室1插电负载
9	PMP	水泵及部分公用设施
10	WHB1	卧室1热水器
11	ACB1	卧室1空调

B. 功率状态分配

此过程旨在从功率中识别出功率状态，涉及数据集生成过程中的消耗数据。合适的功率数据划分方法将提供具有代表值的适当数量的分区。因此，工作流程分为两个阶段：功率状态建模和选择最佳功率状态数量，如下所述。

1) 基于K均值聚类的功率状态建模

K‐均值聚类是一种数据分析技术，用于将一组数据自然地划分为K个簇[35]。每个簇都有一个均值，该均值由簇内所有数据的平均值得出，每个样本根据条件(1)被分配到最近的簇均值。在电器识别问题中，同一分布内的功率消耗数据(p)属于同一个簇或功率状态，并将簇均值作为该状态的代表性功率值。

$$
\text{arg min} {c(i) \in K} (|\mu {c(i)} - p_j|^2)
$$

其中（$|\mu_{c(i)} - p_j|$）是类别总数C中第i个簇的均值（$\mu_{c(i)}$）与第j个（$p_j$）之间的欧几里得距离。

此阶段旨在获得一组有效的功率状态(S)。通过使用K‐均值聚类进行数据评估，随着K值的增加，生成的簇数量也会增加，且簇均值之间的距离更近。因此，S集合由以下条件确定：任意两个簇之间的簇均值距离不小于阈值($|\mu_{c(i)} - \mu_{c(j)}| >= PTh(c)$)。在此情况下，PTh(c)被设定为0.02千瓦（20瓦），以近似表示如灯（18瓦）等主要家用电器的最小功率消耗值。该条件确保每个簇均由自然分组产生，而非因不合适的K值导致过度分组。图4展示了此流程过程。

2) 使用AUC选择最佳功率状态数量

该阶段旨在确定合适的电器数量功率状态。使用前一阶段的不同K值，构建了不同的单输出数据数据集，其中K值表示类别输出数量或功率状态数量。

为了选择最佳K值，评估了一组多类别数据集。每个数据集以聚合数据作为输入，以功率状态数据（对应特定的K值）作为输出标签。通过交叉验证方法，使用ROC曲线下面积（即AUC指标）对每个数据集的数据分类性能进行量化。该指标表示从分类结果中获得的真正率与假正率之间的关系[36]。这是用于在整个类别分布范围内比较分类器性能的标准指标。图5展示了为每种电器确定最佳功率状态数量（Kopt）的过程。

功率状态根据其数值按顺序分配。如果最小值近似为0千瓦，则基础功率状态设为状态“0”；否则，基础状态设为“1”。因此，针对每个电器标签的数据标注得以确定，用于构建多目标数据集。

示意图3

示意图4

C. 构建多目标数据集

多目标数据集由数据输入特征(X)和类别输出(Y)，其中每个电器标签表示对聚合输入数据有贡献的相关离散功率状态。选择参数P‐Q‐I‐PF作为输入特征，因为它们中的每一项都可以反映电器在离散时间内的使用情况，这对数据学习过程很有帮助。每个电器标签的数据代表由先前过程得出的功率状态。多目标数据集的示例如图6所示。该数据集包含M个电器标签和N个数据实例。

示意图5

D. 预测模型的构建与评估

在获得多目标数据集后，通过数据学习算法构建分类模型。用于处理多输出数据的学习算法可分为问题转换和算法适应两种方法[33, 37]。前一种方法通过多目标分类器将多输出数据转换为特定格式的单输出分类问题，然后应用单输出分类器（例如神经网络、k近邻）来构建预测模型；后一种方法则调整单输出分类器的操作，以直接应用于多输出数据。

选择基于问题转换方法的分类器——通过不相交子集的随机k标签集（RAkELd）[38]，并分别采用决策树作为多目标分类器和基础分类器。RAkELd分类器在构建分类器时考虑了输出标签之间的相关性，其分类性能已被证明优于将输出标签视为独立标签的分类器[20, 38]。该分类器采用集成方法，从标签空间中无放回地随机选择“k”个标签的子集。因此，“k”的取值范围为1 ≤ k<(L/2)，其中L是标签总数。每个标签子集可通过单输出分类算法进行学习。这种处理较少类别标签集合的学习过程，相较于在单一集合中处理所有标签的方法，能够降低复杂性和类别不平衡问题。

对于基础分类器，采用基于C4.5算法的决策树，因为该算法已在众多分类任务领域中成功应用[39]。树模型是由所选属性作为决策节点构成的数据决策路径以及将决策输出作为叶节点。树的分裂准则考虑最具信息量的属性或信息增益，即父节点与子节点加权平均之间数据不纯度（IH）的最大降低。不纯度的计算如公式(2)所示，其中pi表示属性内类别i的数据概率，jth个子节点的类别总数为C。

$$
IH(j) = \sum_{i=1}^{C} -p_i \log_2 p_i
$$
以及将决策输出作为叶节点。树的分裂准则考虑最具信息量的属性或信息增益，即父节点与子节点加权平均之间数据不纯度（IH）的最大降低。不纯度的计算如公式(2)所示，其中pi表示属性内类别i的数据概率，jth个子节点的类别总数为C。

$$
IH(j) = \sum_{i=1}^{C} -p_i \log_2 p_i
$$

下文的子主题中描述了预测性能的常用评估指标以及数据操作过程。

IV. 评估工具与指标

A. 应用工具与评估指标

本研究使用MEKA软件[31]对多目标数据集进行数据学习处理。WEKA[40]用于分析K‐均值聚类和多类分类。该软件是基于Java的开源程序，具有易于使用的用户界面，可在开发阶段为指定的数据学习方案提供快速的性能结果。

在分类器的预测性能评估中，采用了标签准确率和F分数指标，因为它们常用于多输出数据学习[37],和非侵入式负荷监测应用[18, 41]。每种评估指标简要描述如下。

标签准确率 ：准确率直观地反映了分类算法的有效性。该指标评估每个标签的预测结果与真实数据在正确性方面的匹配程度，如公式(3)所示。

$$
\text{Label accuracy} = \frac{1}{N} \sum_{i=1}^{N} (h(x_i) = y_i)
$$

其中 $ h(x_i) $ 和 $ y_i $ 分别是数据实例 $ i $ 的预测输出数据和真实输出数据。$ N $ 是数据实例的数量。

由于每个电器标签的数据被划分为多类别数据，其在类别集合中的分布往往不平衡，其中“0”（功率关闭）通常是特定时间段内的多数类别。在二元分类中，通过精确率（TP/(TP+FP)）和召回率（TP/(TP+ FN)）来评估性能，以区分来自另一类别的正确数据预测。此处，TP、FP 和 FN 分别表示真正例、假阳性与假阴性样本的数量。对于多类别数据，采用一对所有（OvA）方法，将关注的类别视为正类，其余所有类别均视为负类[42]。

F分数 ：一种用于计算精确率（P）和召回率（R）调和平均值的性能度量。F分数采用宏平均方式进行评估，即对于单个电器标签，该度量针对每个数据类别计算P和R，并按类别数量进行平均，如公式(4)所示。

$$
\text{F-score(macro-average)} = \frac{1}{K} \sum_{c=1}^{K} \frac{2 \times P_c \times R_c}{P_c + R_c}
$$

其中，$ K $ 是电器标签内的类别数量。$ P_c $ 和 $ R_c $ 分别是每个类别的精确率和召回率。

B. 数据学习和测试的数据集处理

为了评估分类器的预测性能，数据集被划分为两个互不重叠的集合：训练集和测试集。训练集用于通过交叉验证过程来训练和验证模型。所选的分类算法用于预测测试集的类别（功率状态），以评估模型泛化性能。数据实例按86,400个样本和21,600个样本分别划分为训练集和测试集，比例为80:20[43]。

C. 功率和能耗估计

电器标签的估计功率消耗值由相关联的功率状态的代表性功率值提供。本工作使用功率归一化误差来衡量预测功率数据与真实功率数据之间的误差，如公式(5)所示：[41]，其中 $ P_{\text{test}}(i) $ 和 $ \hat{P}_{\text{test}}(i) $ 分别为测试集（大小为N）的真实功率和预测功率的数据实例。

$$
\text{Normalized error of power(\%)} = \frac{\sum_{i=1}^{N} |P_{\text{test}}(i) - \hat{P} {\text{test}}(i)|}{2 \times \sum {i=1}^{N} P_{\text{test}}(i)} \times 100
$$

能耗数据通过在测试集数据的时间段内累积功率值来计算。由于数据集的数据间隔为一分钟，因此预测的能耗数据（$ \hat{E}_{\text{test}} $）（千瓦时）由公式(6)表示。

$$
\hat{E} {\text{test}}(\text{kWh}) = \frac{1}{60} \times \sum {i=1}^{N} \hat{P}_{\text{test}}(i)
$$

为了计算能量预测误差或偏差，将预测的能量值（$ \hat{E} {\text{test}} $）与真实能量值（$ E {\text{test}} $）进行比较，其中真实能量值是真实功率数据的累积。能量预测百分比误差由 $ \% \Delta E_{\text{test}} $ 表示，如公式(7)所示。

$$
\% \Delta E_{\text{test}} = \frac{1}{E_{\text{test}}} \times (\hat{E} {\text{test}} - E {\text{test}}) \times 100
$$

V. 结果与讨论

A. 数据训练阶段

实验进行了通过数据采集、功率状态分配和模型配置来构建学习模型。每个子过程的结果将在以下子主题中进行说明。

1) 数据采集

为了确定功率状态分配可以根据电器功率数据统计生成，通过阶梯直方图绘制的概率密度，检查了每个电器在训练集中的功率数据分布情况，如图7所示。这些图表简要展示了功率

示意图6

状态分配可以根据电器功率数据统计生成。

如图所示，照明标签属于低功率电器类别，插座负载标签和热水器则是功率消耗范围较广的电器。除客厅插座负载（PLL）外，大多数电器标签处于断电状态，其中大量功率数据的值集中在0千瓦左右。

2) 功率状态分配

每个的功率数据使用第III节中描述的方法，通过K‐均值聚类和多类分类对该电器进行分析，分别得到(S)集合和AUC值集合。从AUC值集合中选择最大数值（粗体数字）作为最佳功率状态数量，如表II所示。

表II 确定最佳功率状态数量

电器标签	有效功率状态数 (S)	AUC值集合	最优功率状态数
LHL	{2, 3, 4}	{0.96, 0.962, 0.957}	3
LHK	{2, 3}	{0.973, 0.967}	2
LHB1	{2, 3}	{0.907, 0.897}	2
LHB2	{2}	{0.734}	2
PLL	{2, 3, 4, 5}	{0.964, 0.963, 0.966, 0.94}	4
PLK	{2, 3}	{0.812, 0.955}	3
PLB1	{2, 3, 4}	{0.956, 0.958, 0.95}	3
PMP	{2, 3, 4, 5}	{0.499, 0.801, 0.789, 0.78}	3
WHB1	{2, 3, 4, 5, 6}	{0.987, 0.992, 0.985, 0.981, 0.976}	3
ACB1	{2, 3}	{0.993, 0.972}	2

表II的输出被展开为每个功率状态的功率状态分配及其代表性功率值，如表III所示。功率状态分配的结果表明，最佳功率状态数量及其代表性值与功率数据分布在高峰值数量（功率状态数量）和峰值位置（功率状态的代表值）方面大致相符，如图7所示。对于插座负载或热水器等在通电状态下功率状态不明显的电器，通过对功率范围内的数据进行平均的简要划分，也可以得到类似的结果。

此外，代表性功率值还说明了电器功率特性的行为。插座负载标签的基态“1”表示连续用电模式（例如，通过待机模式关闭功率）。而电器标签的基态“0”表示在电源关闭时完全切断功率消耗。

表III 功率状态分配及代表性功率值

电器标签	‘0’ (kW)	‘1’ (kW)	‘2’ (kW)	‘3’ (kW)
LHL	0.005	0.066	0.241
LHK	0	0.034
LHB1	0	0.054
LHB2	0	0.020
PLL	0.051	0.201	0.340	1.871
PLK	0.020	0.074	1.255
PLB1	0.022	0.220	1.251
PMP	0.002	0.049	0.401
WHB1	0	1.505	2.592
ACB1	0.003	1.265

3) 数据学习性能

前一阶段的输出被处理以构建多目标数据集。在获得多目标数据集后，通过10折交叉验证对F分数进行数据学习，以评估分类性能准确率值。将RAkELd与C4.5分类器应用于训练集，得到了表IV所示的结果。

空调和热水器等高功率电器往往比照明和插座负载提供更好的F值和准确率值。这是因为高功率负载在功率状态切换时具有更大的阶跃变化，且特征数据重叠较少，从而使分类器能够清晰地识别正确的功率状态。因此，它们能产生更高的正确预测得分。

由于照明LHB2和水泵PMP的功率消耗较低且使用因子较低（通电状态或非零数据的比例），其F分数值相对较低。低功耗电器在功率状态发生变化时，功率数据仅产生较小的阶跃变化，导致树模型的数据决策路径复杂，从而产生大量错误预测（假阳性和假阴性）。此外，低利用率因子导致真阳性数量较少，相对于假阳性或假阴性而言，精确率和召回率也较低。因此，这些电器特性导致了相对较低的F分数值。

4) 模型选择

模型选择是确定分类器有效性能的模型参数配置的过程。RAkELd与决策树分类器的选择在第三节-D中进行了描述。对于决策树分类器，其模型参数为置信因子(C)，用于控制剪枝程度，以获得最优模型复杂度并实现最优泛化性能。通过在训练集上对不同C的模型配置进行交叉验证并评估F分数，确定了最优的C值。可用的参数范围是0 < C ≤ 0.5，共6个试验值，发现C = 0.25可提供最大的F分数值。

对于RAkELd多目标分类器，模型参数(k)根据先前建议设置为默认值(k = 3)[38]。一组十个电器标签用数字“1”到“10”标记。MEKA将这些标签随机采样为三个子集：[3,4, 6],[1, 2, 8],和 [5, 7, 9, 10]。每个子集为一个树模型提供输出，表示与相关标签集对应的预测数据。例如，如果感兴趣的电器是热水器（WHB1，标签9），则应关注四元素子集 [5, 7, 9, 10]中的第三个元素。图8展示了从训练集构建的树模型的一个片段。方括号中的第三个数字（粗体数字）表示该决策路径下热水器的预测功率状态。此外，括号中的数字分别表示相关数据实例的总数和错误预测样本的数量。

B. 数据测试阶段

在获得选定的（参数调优）模型后，需应用该模型来预测新聚合数据。通过预测电器功率状态以及功率和能耗数据的估计，其泛化性能将由以下子主题进行评估。

1) 泛化预测性能

预测模型在应用于评估测试集时的估计能力如表V所示。预测值与执行交叉验证的结果一致，但数值略低。

表V 用于识别电器功率状态的广义预测性能

电器标签	F分数	准确率
LHL	0.805	0.859
LHK	0.898	0.899
LHB1	0.771	0.926
LHB2	0.556	0.948
PLL	0.795	0.847
PLK	0.689	0.925
PLB1	0.713	0.915
PMP	0.380	0.980
WHB1	0.894	0.998
ACB1	0.989	0.993

2) 功率和能耗预测

一天的功率数据图对于某些电器标签，图9展示了预测数据如何跟踪实际数据。功率数据跟踪的误差通过功率归一化误差进行量化。此外，能耗数据的预测误差总结见表VI。

通常，单个标签中的高功率电器（WHB1 和 ACB1）提供的功率消耗数据较为稳定，其功率预测误差和能量预测百分比误差（%ΔEtest）往往低于低功率电器（照明）和变功率电器（plug-loads）。该结果与表V中功率状态预测的结果一致，也与以往研究[6, 7]的结论相符，即高功率电器通常比低功率电器具有更高的预测性能。

LHB2和PMP的F分数值较低，其功率和能耗预测的误差也相对较高。然而，由于这些电器的功率负载低且使用因子低，其实际能源消耗值非常低。因此，这类电器对能耗预测系统整体性能的影响较小。

C. 讨论

所提出的功率状态建模技术的有效性可以通过两方面来验证。首先，多目标数据集的质量，如交叉验证结果所示表IV提供了大多数电器标签的F分数值高于0.8的结果。这表明由功率状态建模所启动的数据集生成具有良好的一致性。其次，所提出的多状态模型与先前工作（二元状态模型和因子隐马尔可夫模型（FHMM））在功率预测归一化误差值方面的比较结果如表VII所示。二元状态模型的结果通过将通电状态定义为一个以平均功率作为代表值的单一状态进行实验[20]。对于FHMM[23],，采用了NILMTK[44],（一种用于评估非侵入式负荷监测（NILM）性能的工具包）中的算法。该方法使用精确推理算法来推断电器功率状态和功率消耗数据。由于采用了更精细的功率状态模型，本研究的方法能够优于二元状态方法。此外，能够引入更多的学习特征（P、Q、I和PF），有助于实现更优的数据学习方案，这是相较于仅从总线路有功功率（P）序列中学习数据的FHMM而言的一大优势。

本文提出了一种用于高效预测电器功率状态的数据学习过程的系统设计。随后，可通过主电表确定并报告功率和能耗信息。通过预测信息，该系统应能够提供电器故障的可能性，并在特定的功率状态序列下，通过监测功率消耗数据异常来提供纠正措施。

对于实际系统应用，在数据训练阶段，通过使用一个目标家庭的聚合通道和所有单个电器标签的电力消耗数据进行收集多回路电表或由服务提供商获取。随后进行数据分析过程，以构建电器功率状态的预测模型。在数据测试阶段，该模型可嵌入开源的单通道电表硬件中。它测量并分析新聚合数据，并提供功率状态预测，以进一步推断功率和能耗数据。可结合功率控制机制和物联网系统[45]的服务扩展，实现实时家庭能源管理。

VI. 结论

所提出的多目标分类框架能够通过多状态模型识别电器的功率状态，并估计非侵入式负荷监测应用中的功率和能耗数据。文中展示了一套数据处理流程，利用K‐均值聚类和AUC优化提取电器功率状态，以构建学习数据，实现最优的功率状态识别性能。评估分别采用RAkELd和决策树作为多目标分类器和基础分类器。电器功率状态的预测性能通过F分数和准确率进行衡量，热水器和空调分别为89%和99%，照明分别为77%和85%，插电负载分别为69%和85%。功率消耗预测的性能通过归一化误差值确定，范围为4–52%，实验中各电器的能耗预测百分比偏差为2–60%，结果表明该方法优于FHMM和二元状态建模框架。

未来的工作是将学习系统扩展为一个动态学习框架，使模型能够直观地适应监测环境中电器数量的变化。我们已经为多输出分类框架实现了一种增量数据学习技术[46, 47]。拥有模型自适应机制使得静态学习平台能够进一步发展为具有更灵活系统的实时嵌入式平台，从而减少在动态数据环境中完全重新训练数据的需求。