
Spark
文章平均质量分 65
DataCareer
这个作者很懒,什么都没留下…
展开
-
Spark调优总结
Spark优化点总结原创 2023-03-05 12:05:57 · 954 阅读 · 0 评论 -
Spark开发注意: collect_list、collect_set会去除Null值
今天我们踩到一个collect_list的坑,collect_list的结果不包含null值namecity张三广州null广州李四深圳对city作group by后collect_list(name)得到的结果中city='广州’为List(‘张三’),没有null值。跟踪源码: def collect_list(e: Column): Column = withAggregateFunction { CollectList(e.expr) }col原创 2021-11-10 08:55:17 · 6201 阅读 · 0 评论