spark2.1.0发布了

本文介绍 Spark 2.1.0 的主要更新,包括默认 Scala 版本为 2.11.x,稳定的数据类型 API,新增 rom_json 和 to_json 方法用于解析 JSON 字符串列,Python 字典作为 StructType 的值创建 PySpark DataFrame,可伸缩的分区处理等功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2016年12月28日发布

此版本更改

默认scala版本是Scala 2.11

官网看到

Spark runs on Java 7+, Python 2.6+/3.4+ and R 3.1+. For the Scala API, Spark 2.1.0uses Scala 2.11. You will need to use a compatible Scala version(2.11.x).

Spark 2.1.0uses Scala 2.11.x(没有+这个符号,高了低了都无法使用),官网是这么写的.笔者本人也没有试过.(有人试过给笔者留言)

,这个版本更关注于可用性,稳定性


更新:

数据类型的api是稳定的api

rom_json和to_json解析JSON字符串列;

当创建PySpark DataFrame,Python字典可以用作StructType的值

可伸缩的分区处理

Kafka 0.10 support in Structured Streaming;

Locality Sensitive Hashing(hash的api有些更新);

SparkR

GraphX

都有些更新.(因为目前没有涉及到此处开发,所以具体没关注)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值