Dataset
Dataset是什么
1 . Dataset是结构化数据
2 . Dataset能够使用类似SQL这样声明式结构化查询语句的形式来查询
3 . Dataset是一个强类型,并且类型安全的数据容器,并且提供了结构化查询API和类似RDD一样的命令式API
DataFrame
DataFrame是什么
1 . DataFrame类似一张关系型数据库
2 . 在DataFrame上操作,非常类似SQL语句
3 . DataFrame中有行和列,以及Scheam
DataFrame如何创建
1 . toDF()
2 . createDataFrame()
3 . spark.read.
Dataset & DataFrame 区别
0 . DataFrame 就是 Dataset[Row]
1 . Dataset是强类型的 而 DataFrame 是弱类型的
2 . DataFrame 的操作方式和Dataset是一样的,但是对于强类型操作而言,他们处理的类型不同
3 . DataFrame只能做到运行时类型检查,Dataset能做到编译和运行时都有类型检查
本文介绍了Dataset和DataFrame的概念,探讨了它们之间的区别。Dataset是结构化数据的强类型容器,支持结构化查询API。DataFrame则类似关系型数据库,提供SQL风格的操作方式。文章还详细解释了DataFrame的创建方法。
471

被折叠的 条评论
为什么被折叠?



