家庭能源消耗模式分析与网络拓扑分区方案
家庭能源消耗模式分析
在对家庭能源消耗模式进行分析时,首先运用了三种不同的特征选择方法,发现这些方法所获取的大部分特征是相同的。经过处理,选出了与目标属性相关性最高的 10 个特征。由于数据记录未标记,采用了无监督聚类方案进行数据分析。
在聚类前,对这 10 个特征的信息进行了调查。根据相关数据可知,平均而言,家庭的年收入在 4 万至 6 万美元之间,房屋通常较大,平均有 6 间卧室,太阳能能源很少用于发电,且加热居住空间所需的能源较高,存在能源浪费的可能性。
接下来,使用了两种聚类算法来研究家庭的能源消耗行为:
1. 基于距离的聚类(k - means) :
- 该算法将数据划分为 k 个簇,使簇之间的距离平方和最小。
- 首先使用不同的 k 值执行 k - means 算法,找到最优的 k 值为 4。
- 然后使用 k = 4 对数据进行划分,得到四个簇,大小分别为 1541、286、899 和 2960。
- 各个簇的特征如下:
- 第一个簇:家庭每周频繁使用洗衣机和烘干机,使用适量的灯泡,加热空间的能源使用量平均甚至更低,以减少电费支出,不使用太阳能板,家庭年收入相对较低(一般在 2 万至 6 万美元之间),占比 27.10%。
- 第二个簇:家庭加热生活空间和水使用的能源较多,电费较高,不使用太阳能板,家庭年收入高(一般超过 14 万美元),房屋较大,房间和窗户较多,占比 5.02%。
- 第三个簇:特征是前两个簇的组合,占比 15.81%。
- 第四个簇:家庭通常没有洗衣机和烘干机,房屋内使用的灯泡数量
超级会员免费看
订阅专栏 解锁全文
31

被折叠的 条评论
为什么被折叠?



