在物联网时代,大量的感知器每天都在收集并产生着涉及各个领域的数据。物联网提供源源不断的数据流,使实时数据分析成为分析数据的理想工具。

模拟一个智能物联网系统的数据统计分析,产生设备数据发送到Kafka,结构化流Structured Streaming实时消费统计。对物联网设备状态信号数据,实时统计分析:
- 1)、信号强度大于30的设备;
- 2)、各种设备类型的数量;
- 3)、各种设备类型的平均信号强度;
1. 设备监控数据
编写程序模拟生成物联网设备监控数据,发送到Kafka Topic中,此处为了演示字段较少,实际生产项目中字段很多。
1.1 创建 Topic
启动Kafka Broker服务,创建Topic【search-log-topic】,命令如下所示:
# 启动Zookeeper
/export/server/zookeeper/bin/zkServer.sh start
# 启动Kafka Broker
/export/server/kafka/b
该博客探讨了在物联网时代如何利用Spark的Structured Streaming进行实时数据分析。通过模拟生成物联网设备监控数据发送到Kafka,然后使用DataFrame和SQL进行处理,实时统计信号强度大于30的设备、设备类型数量及平均信号强度。详细介绍了创建Kafka Topic、模拟数据产生以及具体的DataFrame和SQL分析步骤。
订阅专栏 解锁全文
855

被折叠的 条评论
为什么被折叠?



