sparkSQL
murphyZ
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
spark2.0版本之后的sparkSQL新特性
spark2.0之后的sparkSQL 1、spark2.0以后,我们操作的sql的对象为DataSet, DataFrame只是DataSet[Row] (row是弱类型) DataSet有弱类型(untyped)和强类型(typed) 2、SparkSession作为新版本的上下文,可以用在sql和streaming中, SparkSession把SQLContext和HiveContext整...原创 2019-03-05 23:56:53 · 869 阅读 · 0 评论 -
DataFrame常用操作
1.1. DataFrame常用操作 1.1.1. DSL风格语法 //查看DataFrame中的内容 personDF.show //查看DataFrame部分列中的内容 personDF.select(personDF.col(“name”)).show personDF.select(col(“name”),col(“age”)).show personDF.select(“name”)...原创 2019-03-04 19:25:59 · 809 阅读 · 0 评论 -
SparkSQL & Dataframes
整理至spark官网 (官网:http://spark.apache.org) 1、What is sparkSQL? (概念) 2、HQL(hive sql)与sparkSQL的对比 3、dataframes(概念、DF创建、DF常用操作(DSL风格、SQL风格)) 1、What is sparkSQL? (概念) Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象...原创 2019-03-04 19:26:58 · 257 阅读 · 0 评论
分享