物联网分析与伦理:从知识提取到可持续发展
1. 物联网分析中的知识提取与操作化
VITAL可用于知识提取以及物联网分析的部署和操作化。在部署物联网分析应用之前,需要发现和测试能够以可靠方式提取所需知识的物联网数据挖掘算法。物联网数据挖掘与传统数据挖掘应用类似,因此可以应用主流的数据挖掘和分析模型,如跨行业数据挖掘标准流程(CRISP - DM)模型。
CRISP - DM模型包含以下活动和阶段:
- 业务理解 :这是过程的起点,需要理解手头的业务问题。对问题本质的深入理解是确定合适机器学习模型的关键前提。
- 数据理解 :在业务理解之后进行,旨在理解数据。经验丰富的数据科学家通过检查和理解数据,可以获得关于某些数据挖掘方案适用性的宝贵见解,并识别数据集中的数据模式,为确定候选机器学习方案提供基础。
- 数据准备 :这是一个繁琐但不可或缺的任务。收集的数据集需要转换为适合识别数据挖掘和机器学习模型的格式。在传统数据挖掘应用中,数据准备步骤涉及多个ETL(提取、转换、加载)过程。在物联网分析中,数据工程师需要处理大量不同的数据源和格式。语义互操作性解决方案(如VITAL)有助于简化数据准备过程。
- 建模 :利用从物联网系统收集的数据集,为手头的问题确定合适的机器学习方案。数据挖掘工具(如RapidMiner和Weka)可用于根据训练数据集生成机器学习模型。建模阶段与数据准备阶段密切交互,以确保可用的训练数据集适合目标模型。
- 评估 :对生成的模型进行效率评估,包括
超级会员免费看
订阅专栏 解锁全文
51

被折叠的 条评论
为什么被折叠?



