Spark Streaming Programming Guide 1.6.2官方指导
http://spark.apache.org/docs/1.6.2/streaming-programming-guide.html
Spark Streaming可以监听本地文件、HDFS、端口、flume、kafka等。
Linux下监听端口9999实现wordcount:
1.代码实现
配置SparkContext时,需要‘local[2]’,因为需要两个线程,一个端口监听一个计算
每十秒进行一次计算
#------------------------------word count-----------------------

本文介绍了如何使用Spark Streaming在Linux环境下监听端口9999进行WordCount操作,以及通过配置SparkContext实现本地目录监听。在Linux下,通过nc命令发送数据到端口,Spark Streaming每10秒执行一次计算。同时,文章讨论了监听本地目录的情况,指出手动复制文件无法触发计算,但可以通过代码方式在目录中创建文件以实现监听。
最低0.47元/天 解锁文章
2259

被折叠的 条评论
为什么被折叠?



