Spark Dataset & DataFrame

本文介绍了Dataset和DataFrame的概念,探讨了它们之间的区别。Dataset是结构化数据的强类型容器,支持结构化查询API。DataFrame则类似关系型数据库,提供SQL风格的操作方式。文章还详细解释了DataFrame的创建方法。

Dataset

Dataset是什么

1 . Dataset是结构化数据
2 . Dataset能够使用类似SQL这样声明式结构化查询语句的形式来查询
3 . Dataset是一个强类型,并且类型安全的数据容器,并且提供了结构化查询API和类似RDD一样的命令式API

DataFrame

DataFrame是什么

1 . DataFrame类似一张关系型数据库
2 . 在DataFrame上操作,非常类似SQL语句
3 . DataFrame中有行和列,以及Scheam

DataFrame如何创建

1 . toDF()
2 . createDataFrame()
3 . spark.read.

Dataset & DataFrame 区别

0 . DataFrame 就是 Dataset[Row]
1 . Dataset是强类型的 而 DataFrame 是弱类型的
2 . DataFrame 的操作方式和Dataset是一样的,但是对于强类型操作而言,他们处理的类型不同
3 . DataFrame只能做到运行时类型检查,Dataset能做到编译和运行时都有类型检查

ROW

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值