Spark2.0以后都是SparkSession作为程序入口的,这样的好处是便于使用Dataset<Row>的接口。按照日常需求,将其大致分为三类:
1.读接口,即取数据

2.写接口,即存数据

3.操作接口,即计算数据

这三类大致将Spark使用频率很高一些方法整理到一起,可以在使用的时候方便查阅。
-----end-----
本文介绍Spark2.0中引入的SparkSession及其提供的Dataset<Row>接口,并将其功能归纳为读取数据、存储数据及计算数据三大类,方便读者快速查阅并掌握这些常用API。
Spark2.0以后都是SparkSession作为程序入口的,这样的好处是便于使用Dataset<Row>的接口。按照日常需求,将其大致分为三类:
1.读接口,即取数据

2.写接口,即存数据

3.操作接口,即计算数据

这三类大致将Spark使用频率很高一些方法整理到一起,可以在使用的时候方便查阅。
-----end-----

被折叠的 条评论
为什么被折叠?