SparkContext can only be used on the driver, not in code that it run on workers. see SPARK-5063

It appears that you are attempting to reference SparkContext from a broadcast variable, action, or transformation. SparkContext can only be used on the driver, not in code that it run on workers. For more information, see SPARK-5063.

如果你的pyspark里面有两层map,且内层map使用了sc(SparkContext),就会报这个错误,原因是说sc只能在你的main函数里面使用,不能在map并发中调用 (SparkContext can only be used on the driver, not in code that it run on workers)

所以需要将两层map改为一层map,或者不在内层使用sc,

在最外层将所有数据压扁处理flatmap  or  join

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值