- 博客(7)
- 收藏
- 关注
原创 【spark优化】grouping sets + count(distinct)优化
当使用grouping sets/CUBE时,运行速度非常慢,同时像count(distinct())且没有数据倾斜,如何进行优化?
2025-12-09 23:14:59
402
原创 选择排序:原理演示与代码实现
选择排序需要完全遍历列表两次,每次都只能对比出一个元素的最小值。所以时间复杂度为O(n^2)。选择排序适合小数据量,少元素的排序。
2025-12-07 18:32:31
126
原创 oracle数据库的sql优化方案(基于实际工作中的使用为目的出发点)
oracle数据库的简单sql优化方案我们在使用oracle数据库时,难免会接触到sql优化的问题,比如说,亿级表之间的关联,大表之间的复杂查询,难免会遇到效率的问题,下面让我们来探讨一下如何在工作中优化sql(本文以实际工作为出发点,暂不涉及oracle运行原理方面和索引等问题,谢谢)1.亿级表之间的简单关联rowid:在工作中,我们通常使用一张表中的部分数据去过滤掉另外一张表的数据,在...
2019-06-16 13:54:19
297
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅