28、Spark 3.0 新特性深度解析

Spark 3.0 新特性深度解析

1. 版本变更概述

Spark 3.0 带来了诸多功能上的改变,若要详尽列举,篇幅会极长。下面为大家介绍一些显著的新特性。

2. 支持与弃用的语言
  • 支持的语言 :Spark 3.0 支持 Python 3 和 JDK 11,且要求 Scala 版本为 2.12。
  • 弃用的语言 :所有早于 3.6 的 Python 版本以及 Java 8 已被弃用,使用这些版本会收到警告信息。
3. DataFrame 和 Dataset API 的变化
  • unionAll() 方法 :在之前的 Spark 版本中,Dataset 和 DataFrame API 已弃用 unionAll() 方法。但在 Spark 3.0 中,情况反转, unionAll() 现在是 union() 方法的别名。
  • groupByKey() 方法 :早期版本的 Spark 的 Dataset.groupByKey() 在键为非结构体类型(如 int、string、array 等)时,分组后的 Dataset 会将键错误地命名为 value 。例如, ds.groupByKey()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值