SparkStreaming
1、创建一个SparkConf()
2、新建SparkContext
3、新建StreamingContext(SparkContext,time间隔)
4、 |->socketTextStream(“ip”,port)
5、对Dstream进行操作
6、启动Sparkstreaming程序
.start
7、等待优雅的退出
8、ssc.awaitTermination()
最少两个线程 receiver calculater
累加历史数据,就要把中间结果保存起来
两种方式:
1、保存中间结果
val ssc = new StreamingContext(conf, Seconds(5))
ssc.checkpoint("./ck")
2、使用redis
创建关键字、实现累加
本文详细介绍了SparkStreaming的实现步骤,从配置SparkConf到启动StreamingContext,再到通过socket接收数据流,最后对Dstream进行操作并优雅退出。文章还探讨了如何通过检查点和Redis保存中间结果以实现数据累加。
1万+

被折叠的 条评论
为什么被折叠?



