电力数据聚类与无线自组网Sybil攻击防御研究
1. 电力数据聚类分析
在对 5 个客户的电力使用数据进行聚类分析时,为了找到最优的聚类方案,我们考虑了 2 - 6 个聚类集合。首先使用 K - Means 方法对数据进行分组,之后运用 DBI(Davies - Bouldin Index)方法计算每个聚类集合的优化水平。
以下是不同聚类集合的相关计算结果:
| 聚类集合 | DBI 值 | 各聚类成员数量 |
| ---- | ---- | ---- |
| 2 | 1.234 | 聚类 1: 15;聚类 2: 88 |
| 3 | 0.931 | 聚类 1: 4;聚类 2: 58;聚类 3: 41 |
| 4 | 0.893 | 聚类 1: 12;聚类 2: 54;聚类 3: 34;聚类 4: 3 |
| 5 | 1.174 | 聚类 1: 4;聚类 2: 51;聚类 3: 35;聚类 4: 3;聚类 5: 40 |
| 6 | 0.990 | 聚类 1: 4;聚类 2: 51;聚类 3: 35;聚类 4: 1;聚类 5: 10;聚类 6: 2 |
从计算结果可知,聚类集合 4 的 DBI 值最小,为 0.893,这表明该聚类集合中每个对象与质心的密度最佳,且聚类之间的距离也分隔得很好,所以它是最优化的聚类集合。
在得到最优聚类集合后,进入测试阶段。选取 3 个被归类为电力使用异常的客户数据进行测试。具体操作是,确定每个测试数据对象到聚类 4 集合中各质心的距离,然后将这 3 个数据输入应用程序进行测试。结果显示,所有 3 个数据都被归类为电力使用异常的客户,原因是在将数据分配到最近的聚
超级会员免费看
订阅专栏 解锁全文
2617

被折叠的 条评论
为什么被折叠?



