探索与创新:物联网数据的深度挖掘与价值提升
1. 物联网数据初探
通过对数据的初步剖析,我们能有不少发现。比如,天气站数据集并非涵盖每个站点在特定时期的完整历史记录,记录可能仅在有情况需要汇报时才发送,并非每天每 15 分钟都有记录,甚至有些站点每月仅在 1 号汇报一次。
我们还发现了降水累积量随时间变化的潜在有用模式,并在数据中识别出极端事件,且经外部验证确有其事。利用 R 语言,我们了解了数据中每个字段值的统计分布。同时,对站点的地理分布进行了探索,发现科罗拉多州的站点分布并不均匀。此外,还识别出一些看似作为指标而非测量值的数据(如 -9999、999.990)。
查看数据集文档时,发现文档中提到值 99999 与测量标志 a 或 A 表示降水累积的开始和结束,但数据集中并未出现这些值和标志。这给我们的启示是,物联网数据的文档可能存在错误,要相信数据但也要进行验证,因为不同设备的逻辑实现可能不一致,导致数据值混杂。
2. 不同行业的物联网数据分析要点
2.1 制造业
- 制造过程数据 :在制造过程中生成的物联网数据,记录值的准确性尤为重要。需探索数据中的异常值,仔细分析分布,并与制造过程专家核实数据范围和分布。确保测量值尽可能准确有两大好处:一是使检测问题的机器学习模型更准确;二是避免因无效数据导致的误报,否则可能会使生产线和产品交付停滞,造成高昂成本,长期来看还可能导致公司管理层拒绝使用分析结果。
- 产品运营数据 :产品交付并投入使用后,产品的使用年限是关键因素。许多问题与产品使用时间长短相关,如早期
超级会员免费看
订阅专栏 解锁全文
1065

被折叠的 条评论
为什么被折叠?



