泰迪智能科技(数据挖掘平台:TipDM数据挖掘平台)最新推出的数据挖掘实战专栏
专栏将数据挖掘理论与项目案例实践相结合,可以让大家获得真实的数据挖掘学习与实践环境,更快、更好的学习数据挖掘知识与积累职业经验
专栏中每四篇文章为一个完整的数据挖掘案例。案例介绍顺序为:先由数据案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程中同时穿插操作训练,把相关的知识点嵌入相应的操作过程中。
为方便读者轻松地获取一个真实的实验环境,本专栏使用大家熟知的Python语言对样本数据进行处理以进行挖掘建模。
————————————————
分析方法与过程
热水器用户用水事件划分与识别案例的总体流程如下图所示。

图1 热水器用户用水识别建模总体流程
热水器用户用水事件划分与识别案例主要包括以下5个步骤。
(1) 对热水用户的历史用水数据进行选择性抽取,构建专家样本。
(2) 对步骤(1)形成的数据集进行数据探索分析与预处理,包括探索水流量的分布情况,删除冗余属性,识别用水数据的缺失值,并对缺失值作处理,根据建模的需要进行属性构造等。根据以上处理,对用水样本数据建立用水事件时间间隔识别模型和划分一次完整的用水事件模型,再在一次完整用水事件划分结果的基础上,剔除短暂用水事件缩小识别范围等。
(3) 在步骤(2)得到的建模样本数据基础上,建立洗浴事件识别模型,对洗浴事件识别模型进行模型分析评价。
(4) 对步骤(3)形成的模型结果应用并对洗浴事件划分进行优化。
(5) 调用洗浴事件识别模型,对实时监控的热水器流水数据进行洗浴事件自动识别。
数据探索分析
数据挖掘实战专栏:热水器用水事件分析

泰迪智能科技推出数据挖掘实战专栏,结合理论与案例,用Python处理样本数据。以热水器用户用水事件为例,介绍了总体流程,包括数据抽取、探索分析与预处理、建模、模型评价与优化等步骤,还对水流量和用水停顿时间间隔进行了分析。
最低0.47元/天 解锁文章
1776





