Spark学习笔记:基于Socket的实时计算WordCount

基于Socket的实时计算WordCount

Socket简述

Socket(套接字),用来描述IP地址和端口,是通信链的句柄,应用程序可以通过Socket向网络发送请求或者应答网络请求。Socket是支持TCP/IP协议的网络通信的基本操作单元,是对网络通信过程中端点的抽象表示,包含了进行网络通信所必须的五种信息:连接所使用的协议,本地主机的IP地址,本地远程的协议端口,远程主机的IP地址以及远程进程的协议端口。

netcat

netcat是一个用于TCP/UDP连接和监听的Linux工具,主要用于网络传输及调试领域,简称nc
安装只需要yum install nc,不过CentOS7已经自带了。

编写基于Socket的实时WordCount

package StreamingDemo

import org.apache.log4j.{Level, Logger}
import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}

/**
  * 基于Socket的实时WordCount
  */
object SocketWordCount {
  def main(args: Array[String]): Unit = {

    //设置日志级别
    Logger.getLogger("org").
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值