RDD
创建RDD从本地文件创建 # 1.初始化 SparkContext,该对象是 Spark 程序的入口 sc=SparkContext('local','sapp')# 文本文件 RDD 可以使用创建 SparkContext 的t extFile 方法。此方法需要一个 URI的 文件(本地路径的机器上,或一个hdfs://,s3a://等URI),并读取其作为行的集合# 2.读取本地文件,URI为:/root/wordcount.txt rdd = sc.textFile('/roo
原创
2020-12-15 18:50:24 ·
207 阅读 ·
0 评论