版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
传送门:大数据系列文章目录
官方网址:http://spark.apache.org/、 http://spark.apache.org/sql/
SparkSQL的介绍
Spark SQL允许开发人员直接处理RDD,同时可以查询在Hive上存储的外部数据。 Spark SQL的一个重要特点就是能够统一处理关系表和RDD,使得开发人员可以轻松的使用SQL命令进行外部查询,同时进行更加复杂的数据分析。
前世今生
SparkSQL模块一直到Spark 2.0版本才算真