将函数应用于 RDD 中的每个元素,将返回的迭代器的所有内容构成新的 RDD。通常用来切分单词
flatmap 输入是一输出是多
直接上代码
输入是文件 文件内容是
flume sd hadoop hbase kylin hdfs hadoop sd sd flume hdfs
String logFile = "D:\\ab.txt";
SparkConf conf = new SparkConf().setMaster("local").setAppName("TestSpark");
JavaSparkContext sc = new JavaSparkContext(conf