mysql 中通常要用到的 group_concat 进行分组统计 千万级的数据量使用group_cancat mysql 性能达到瓶颈
使用sparksql 实现相同功能 语法如下:
SELECT concat_ws(',',collect_set(name)) FROM A GROUP BY class
本文探讨了在处理千万级数据量时,MySQL中group_concat函数的性能瓶颈,并介绍了一种使用SparkSQL进行优化的方法。通过concat_ws和collect_set函数组合,可以实现更高效的分组统计。
mysql 中通常要用到的 group_concat 进行分组统计 千万级的数据量使用group_cancat mysql 性能达到瓶颈
使用sparksql 实现相同功能 语法如下:
SELECT concat_ws(',',collect_set(name)) FROM A GROUP BY class
1156
7264

被折叠的 条评论
为什么被折叠?