一、parallelize
调用SparkContext 的 parallelize(),将一个存在的集合,变成一个RDD,这种方式试用于学习spark和做一些spark的测试
scala版本
scala的parallelize有两个参数,第一个是一个Seq集合,第二个是分区数,如果没有则会是默认分区数
scala版本可以选择makeRDD替换parallelize,java版本则没有
val rdd = sc.parallelize(List("A","B","C"))
val rdd1 = sc.makeRDD(List