代码:
public class Wordcount {
private static final Pattern SPACE = Pattern.compile(" ");
public static void main(String[] args) {
SparkConf sparkConf = new SparkConf().setAppName("sparkBoot").setMaster("local");
JavaSparkContext sparkContext = new JavaSparkContext(sparkConf);
//使用外部数据创建RDD 来自于HDFS、本地文件(全部的节点都可以),或者其他Hadoop支持的文件系统
//未安装hadoop时 /config 默认来自本地文件系统,可省略file://
//安装hadoop时 默认来自hdfs 指明来自本地文件系统需使用file:///config
JavaRDD<String> lines = sparkContext.textFile("/config").cache();
lines.map(new Function<String, String>() {