Spark 判断DF为空

博客探讨了在Spark中判断DataFrame(DF)为空的三种方法,并进行了性能测试,提供了执行时间对比,以帮助选择最优方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


不同方案性能测试

我有同样的问题,并且测试了3个主要解决方案:

df!= null df.count> 0
df.head(1).isEmpty()
df.rdd.isEmpty

大约需要9366ms
大约需要5607毫秒
大约需要1921ms

当然这3种有效,但是就性能而言,这是我在执行时间方面在我的机器的同一DF上执行这些方法时发现的

更新另一种方法
<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值