SparkSesson为使用Dataset和DataFrame API编程Spark的入口点。
SparkSesson对象可以创建DataFrame,将Dataframe注册为表,并在表上执行SQL、缓存表、读parquet文件等,通过下面的方式创建SparkSesson
from pyspark.sql import SparkSession
spark = SparkSession.builder.master('local').appName('Word-Count').config('"spark.some.config.option", "some-value"'

最低0.47元/天 解锁文章
2532

被折叠的 条评论
为什么被折叠?



