- 博客(6)
- 收藏
- 关注
原创 Error: Could not find or load main class org.apache.hadoop.mapred.YarnChild
错误原因:mapred-site.xml配置错误。
2024-11-08 20:51:20
254
原创 _pickle.PicklingError: Could not serialize object: Exception:
5、总结:pyspark中的distinct转换操作只针对一个RDD,代码模板为 RDD名.distinct() 效果为去除名为‘RDD名’的RDD中的重复值,莫要与subtract转换操作混淆,我便是因为混淆导致出错。2、错误原因:pyspark中的RDD转换操作使用错误。
2024-05-12 09:16:52
458
原创 Exception: Java gateway process exited before sending its port number
4、校正错误:设置环境变量。3、报错原因:未配置。
2024-05-05 12:05:37
310
2
原创 TypeError: object of type ‘PipelinedRDD‘ has no len()
【代码】TypeError: object of type ‘PipelinedRDD‘ has no len()
2024-04-20 10:53:43
126
1
原创 AttributeError: ‘str‘ object has no attribute ‘leftOuterJoin‘
【代码】AttributeError: ‘str‘ object has no attribute ‘leftOuterJoin‘
2024-04-20 10:48:17
129
1
原创 TypeError: can only join an iterable
【代码】TypeError: can only join an iterable。
2024-04-18 18:05:20
497
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人